Объединённая модель панельных данных
Материал из MachineLearning.
Содержание |
Введение
Панельные данные (Panel data)
Имеется множество объектов (индивидуумы, домашние хозяйства, фирмы, регионы, страны и т.п.), занумерованных индексами . Они наблюдаются в моменты времени . Каждый рассматриваемый объект характеризуется переменными (признаками):
- .
Для большинства баз панельных данных характерно, что они содержат наблюдения о большом количестве объектов за относительно короткий промежуток времени.
Обозначения
Введем обозначения:
- – набор независимых переменных (вектор размерности )
- – зависимая переменная для экономической единицы в момент времени
- – соответствующая ошибка.
- Обозначим также:
- Введем также «объединенные» наблюдения и ошибки:
Здесь – векторы, – матрица.
Преимущества анализа панельных данных перед другими методами
Благодаря специальной структуре панельные данные позволяют строить более гибкие и содержательные модели и получать ответы на вопросы, которые недоступны только в рамках, например, моделей, основанных на пространственных данных.
- Возникает возможность учитывать и анализировать индивидуальные отличия между экономическими единицами, что нельзя сделать в рамках стандартных регрессионных моделей.
- Часто ненаблюдаемые факторы коррелированны с другими переменными. В рамках моделей регрессии это означает, что ненаблюдаемый фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных параметров. Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.
Основные модели анализа панельных данных
- Объединенная модель панельных данных (Pooled model)
- Модель панельных данных с фиксированными эффектами (Fixed effect model)
- Модель панельных данных со случайными эффектами (Random effect model)
Описание объединенной модели
Простейшая модель – это обычная линейная модель регрессии
или в матричной форме
- ,
которая, по существу, не учитывает панельную структуру данных. (Здесь – неизвестный вектор размера .) Считается, что зависимая переменная линейно зависит от всех переменных в тот же момент времени.
В эконометрической литературе данная модель носит название объединенной модели регрессии (pooled model).
Параметры модели: . Для настройки параметров можно использовать метод наименьших квадратов:
- ,
Литература
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.
См. также
- Модель панельных данных с фиксированными эффектами
- Модель панельных данных со случайными эффектами
- Модель панельных данных с временны́ми эффектами
- Ротационная панель
Ссылки
- Panel data (Wikipedia)
- Panel analysis (Wikipedia)
- Random effects model (Wikipedia)
- Fixed effects estimation (Wikipedia)