Объединённая модель панельных данных
Материал из MachineLearning.
Содержание |
Введение
Панельные данные (Panel data)
Имеется множество объектов (индивидуумы, домашние хозяйства, фирмы, регионы, страны и т.п.), занумерованных индексами . Они наблюдаются в моменты времени
. Каждый рассматриваемый объект характеризуется
переменными (признаками):
.
Для большинства баз панельных данных характерно, что они содержат наблюдения о большом количестве объектов за относительно короткий промежуток времени.
Обозначения
Введем обозначения:
-
– набор независимых переменных (вектор размерности
)
-
– зависимая переменная для экономической единицы
в момент времени
-
– соответствующая ошибка.
- Обозначим также:
- Введем также «объединенные» наблюдения и ошибки:
Здесь –
векторы,
–
матрица.
Преимущества анализа панельных данных перед другими методами
Благодаря специальной структуре панельные данные позволяют строить более гибкие и содержательные модели и получать ответы на вопросы, которые недоступны только в рамках, например, моделей, основанных на пространственных данных.
- Возникает возможность учитывать и анализировать индивидуальные отличия между экономическими единицами, что нельзя сделать в рамках стандартных регрессионных моделей.
- Часто ненаблюдаемые факторы коррелированны с другими переменными. В рамках моделей регрессии это означает, что ненаблюдаемый фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных параметров. Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.
Основные модели анализа панельных данных
- Объединенная модель панельных данных (Pooled model)
- Модель панельных данных с фиксированными эффектами (Fixed effect model)
- Модель панельных данных со случайными эффектами (Random effect model)
Описание объединенной модели
Простейшая модель – это обычная линейная модель регрессии
или в матричной форме
,
которая, по существу, не учитывает панельную структуру данных.
(Здесь – неизвестный вектор размера
.)
Считается, что зависимая переменная линейно зависит от всех переменных в тот же момент времени.
В эконометрической литературе данная модель носит название объединенной модели регрессии (pooled model).
Параметры модели: . Для настройки параметров можно использовать метод наименьших квадратов:
,
Литература
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.
См. также
- Модель панельных данных с фиксированными эффектами
- Модель панельных данных со случайными эффектами
- Модель панельных данных с временны́ми эффектами
- Ротационная панель
Ссылки
- Panel data (Wikipedia)
- Panel analysis (Wikipedia)
- Random effects model (Wikipedia)
- Fixed effects estimation (Wikipedia)