Объединённая модель панельных данных

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(уточнение)
Строка 1: Строка 1:
 +
'''Панельные данные''' состоят из наблюдений одних и тех же экономических единиц, которые осуществляются в последовательные периоды времени. Панельные данные насчитывают три измерения: признаки (переменные) – объекты – время. Для них разработаны специальные методы анализа.
 +
== Введение ==
== Введение ==
=== Панельные данные (''Panel data'') ===
=== Панельные данные (''Panel data'') ===
Строка 5: Строка 7:
Для большинства баз панельных данных характерно, что они содержат наблюдения о большом количестве объектов за относительно короткий промежуток времени.
Для большинства баз панельных данных характерно, что они содержат наблюдения о большом количестве объектов за относительно короткий промежуток времени.
 +
 +
Панельные данные ценны для экономистов тем, что при правильном их анализе можно избавиться от влияния индивидуальных особенностей объектов (individual heterogeneity), которые, как правило, являются одной из серьезнейших проблем анализа однократных данных.
=== Обозначения ===
=== Обозначения ===
Строка 17: Строка 21:
::<tex> \begin{equation*} y= \left[ y_1 \\ ...\\ y_n \right] \text{,} \quad X= \left[ X_1 \\ ...\\ X_n \right] \text{,} \quad \varepsilon= \left[ \varepsilon_1 \\ ...\\ \varepsilon_n \right]. \end{equation*}</tex>
::<tex> \begin{equation*} y= \left[ y_1 \\ ...\\ y_n \right] \text{,} \quad X= \left[ X_1 \\ ...\\ X_n \right] \text{,} \quad \varepsilon= \left[ \varepsilon_1 \\ ...\\ \varepsilon_n \right]. \end{equation*}</tex>
-
Здесь <tex>y, \varepsilon</tex> – <tex>nT \times 1</tex> векторы, <tex>X</tex> – <tex>nT \times k</tex> матрица.
+
Здесь <tex>y,\; \varepsilon</tex> – <tex>nT \times 1</tex> векторы, <tex>X</tex> – <tex>nT \times k</tex> матрица.
=== Преимущества анализа панельных данных перед другими методами ===
=== Преимущества анализа панельных данных перед другими методами ===
Строка 24: Строка 28:
* Возникает возможность учитывать и анализировать индивидуальные отличия между экономическими единицами, что нельзя сделать в рамках стандартных регрессионных моделей.
* Возникает возможность учитывать и анализировать индивидуальные отличия между экономическими единицами, что нельзя сделать в рамках стандартных регрессионных моделей.
* Часто ненаблюдаемые факторы коррелированны с другими переменными. В рамках моделей регрессии это означает, что ненаблюдаемый фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных параметров. Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.
* Часто ненаблюдаемые факторы коррелированны с другими переменными. В рамках моделей регрессии это означает, что ненаблюдаемый фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных параметров. Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.
-
 
=== Основные модели анализа панельных данных ===
=== Основные модели анализа панельных данных ===
Строка 42: Строка 45:
В эконометрической литературе данная модель носит название '''объединенной модели регрессии ''' ('''''pooled model''''').
В эконометрической литературе данная модель носит название '''объединенной модели регрессии ''' ('''''pooled model''''').
-
Параметры модели: <tex>\beta \in \mathbb{R}^k, \mu \in \mathbb{R}</tex>. Для настройки параметров можно использовать [[метод наименьших квадратов]]:
+
'''Параметры модели''': <tex>\beta \in \mathbb{R}^k, \mu \in \mathbb{R}</tex>. Для настройки параметров можно использовать [[метод наименьших квадратов]]:
-
::<tex>\sum_{i=1}^n \sum_{t=1}^T (\widehat{y}_{it} - y_{it})^2 \rightarrow \min_{\beta, \mu}</tex>,
+
::<tex>\sum_{i=1}^n \sum_{t=1}^T (\widehat{y}_{it} - y_{it})^2 \rightarrow \min_{\beta, \mu}</tex>.
-
 
+
== Литература ==
== Литература ==
Строка 54: Строка 56:
|страниц = 576
|страниц = 576
}}
}}
 +
# {{книга
 +
|автор =Коленков С.О.
 +
| заглавие = Прикладной эконометрический анализ в статистическом пакете Stata
 +
|год = 2003
 +
|ссылка = http://www.komkon.org/~tacik/Stata6Ec.pdf
 +
}}
 +
== См. также ==
== См. также ==
Строка 66: Строка 75:
* [http://en.wikipedia.org/wiki/Random_effects_model Random effects model] (Wikipedia)
* [http://en.wikipedia.org/wiki/Random_effects_model Random effects model] (Wikipedia)
* [http://en.wikipedia.org/wiki/Fixed_effects_estimator Fixed effects estimation] (Wikipedia)
* [http://en.wikipedia.org/wiki/Fixed_effects_estimator Fixed effects estimation] (Wikipedia)
-
 
[[Категория: Прикладная статистика]]
[[Категория: Прикладная статистика]]

Версия 18:30, 8 января 2009

Панельные данные состоят из наблюдений одних и тех же экономических единиц, которые осуществляются в последовательные периоды времени. Панельные данные насчитывают три измерения: признаки (переменные) – объекты – время. Для них разработаны специальные методы анализа.

Содержание

Введение

Панельные данные (Panel data)

Имеется множество объектов (индивидуумы, домашние хозяйства, фирмы, регионы, страны и т.п.), занумерованных индексами i=1,...,n . Они наблюдаются в моменты времени t=1,...,T . Каждый рассматриваемый объект характеризуется k переменными (признаками):

 x_{it}=(x_{it}^1,...,x_{it}^k) \in \mathbb{R}^k.

Для большинства баз панельных данных характерно, что они содержат наблюдения о большом количестве объектов за относительно короткий промежуток времени.

Панельные данные ценны для экономистов тем, что при правильном их анализе можно избавиться от влияния индивидуальных особенностей объектов (individual heterogeneity), которые, как правило, являются одной из серьезнейших проблем анализа однократных данных.

Обозначения

Введем обозначения:

  •  x_{it} – набор независимых переменных (вектор размерности k )
  •  y_{it} – зависимая переменная для экономической единицы i в момент времени t
  •  \varepsilon_{it} – соответствующая ошибка.
  • Обозначим также:
 \begin{equation*} y_i= \left[y_{i1} \\ ...\\  y_{iT} \right] \text{,} \quad X_i= \left[ x'_{i1} \\ ...\\ x'_{iT}  \right] \text{,} \quad \varepsilon_i= \left[ \varepsilon_{i1} \\ ...\\ \varepsilon_{iT} \right]. \end{equation*}
  • Введем также «объединенные» наблюдения и ошибки:
 \begin{equation*} y= \left[ y_1 \\ ...\\ y_n \right] \text{,} \quad X= \left[  X_1 \\ ...\\ X_n \right] \text{,} \quad \varepsilon= \left[  \varepsilon_1 \\ ...\\ \varepsilon_n  \right]. \end{equation*}

Здесь y,\; \varepsilonnT \times 1 векторы, XnT \times k матрица.

Преимущества анализа панельных данных перед другими методами

Благодаря специальной структуре панельные данные позволяют строить более гибкие и содержательные модели и получать ответы на вопросы, которые недоступны только в рамках, например, моделей, основанных на пространственных данных.

  • Возникает возможность учитывать и анализировать индивидуальные отличия между экономическими единицами, что нельзя сделать в рамках стандартных регрессионных моделей.
  • Часто ненаблюдаемые факторы коррелированны с другими переменными. В рамках моделей регрессии это означает, что ненаблюдаемый фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных параметров. Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.

Основные модели анализа панельных данных

  1. Объединенная модель панельных данных (Pooled model)
  2. Модель панельных данных с фиксированными эффектами (Fixed effect model)
  3. Модель панельных данных со случайными эффектами (Random effect model)

Описание объединенной модели

Простейшая модель – это обычная линейная модель регрессии

 \widehat{y}_{it} = x'_{it} \cdot \beta + \mu = \sum_{j=1}^k {x_{it}^j \cdot \beta_j} + \mu

или в матричной форме

 \widehat{y} = X  \cdot \beta + \mu,

которая, по существу, не учитывает панельную структуру данных. (Здесь \beta – неизвестный вектор размера k \times 1.) Считается, что зависимая переменная линейно зависит от всех переменных в тот же момент времени.

В эконометрической литературе данная модель носит название объединенной модели регрессии (pooled model).

Параметры модели: \beta \in \mathbb{R}^k, \mu \in \mathbb{R}. Для настройки параметров можно использовать метод наименьших квадратов:

\sum_{i=1}^n \sum_{t=1}^T (\widehat{y}_{it} -  y_{it})^2  \rightarrow  \min_{\beta, \mu}.

Литература

  1. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.
  2. Коленков С.О. Прикладной эконометрический анализ в статистическом пакете Stata. — 2003.


См. также

Ссылки

Личные инструменты