Модель панельных данных с временны́ми эффектами

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: == Литература == == См. также == == Ссылки == {{Stub|}} Категория: Прикладная статистика)
Строка 1: Строка 1:
 +
'''Модель панельных данных с временны́ми эффектами ''' (''''' time-varying model for panel data''''') опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются '''эффектами'''. В данной модели эффекты объектов могут изменяться в каждый момент времени.
 +
 +
== Обозначения ==
 +
Введем обозначения:
 +
* <tex> i = 1,...,n</tex> – номера объектов, <tex>t = 1,...,T</tex> – моменты времени, <tex>k </tex> – число признаков.
 +
Для каждого объекта в каждый момент времени известны:
 +
* <tex> x_{it}</tex> – набор независимых переменных (вектор размерности <tex>k </tex>)
 +
* <tex> y_{it}</tex> – зависимая переменная для экономической единицы <tex>i</tex> в момент времени <tex>t</tex>
 +
 +
== Описание модели панельных данных с временны́ми эффектами ==
 +
В введенных обозначениях '''модель панельных данных с с временны́ми эффектами ''' описывается уравнением
 +
{{eqno|1}}
 +
::<tex> \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta </tex>
 +
 +
Здесь <tex>\widehat{y}_{it}</tex> модельное значение зависимой переменной, соответствующее <tex>{y}_{it}</tex>.
 +
Величина <tex>\alpha_i</tex> выражает индивидуальный эффект объекта <tex> i</tex>, не зависящий от времени <tex>t </tex>.
 +
Величина <tex>\gamma_t</tex> выражает зависимость индивидуального эффекта объекта <tex> i</tex> от времени <tex>t </tex> ( будем считать, что всегда <tex>\gamma_1 = 1 </tex> ).
 +
''При этом регрессоры <tex> x_{it} </tex> не содержат константу ''.
 +
 +
'''Параметры модели''': <tex>\beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n), \gamma_t \in \mathbb{R} (i=2,...,T)</tex>.
 +
 +
=== Понижение размерности. Исключение эффектов. ===
 +
Для панельных данных типична ситуация, когда число объектов <tex> n</tex> достаточно велико. Поэтому, применяя непосредственно [[метод наименьших квадратов]] к уравнению {{eqref|1}}, при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты <tex>\alpha_i \cdot \gamma_t</tex>. При этом мы ''понижаем размерность задачи с <tex>(n+k+T-1)</tex> до <tex> k</tex> ''.
 +
 +
Наиболее простой способ – переход в уравнении {{eqref|1}} к средним величинам по времени и по множеству объектов :
 +
{{eqno|2}}
 +
::<tex>\overline{y_i}= \alpha_i + \overline{\gamma} + \overline{x'_i} \cdot \beta </tex> ,
 +
где <tex>\overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\; \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\; \overline{\gamma} = \frac{1}{T} \sum_{t=1}^T \gamma_t</tex>;
 +
{{eqno|3}}
 +
::<tex>\overline{y_t}= \overline{\alpha} + \gamma_t + \overline{x'_t} \cdot \beta </tex> ,
 +
где <tex>\overline{y_t} = \frac{1}{n} \sum_{i=1}^n y_{it},\; \overline{x_t} = \frac{1}{n} \sum_{i=1}^n x_{it},\; \overline{\alpha} = \frac{1}{n} \sum_{i=1}^n \alpha_i</tex>
 +
 +
{{eqno|4}}
 +
::<tex>\overline{y}= \overline{\alpha} + \overline{\gamma} + \overline{x'} \cdot \beta </tex> ,
 +
где <tex>\overline{y} = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T y_{it},\; \overline{x} = \frac{1}{nT} \sum_{i=1}^n\sum_{t=1}^T x_{it},\; </tex>
 +
 +
 +
Из {{eqref|1}},{{eqref|2}},{{eqref|3}},{{eqref|4}} получаем:
 +
{{eqno|5}}
 +
::<tex> \widehat{y}_{it} - \overline{y_i} - \overline{y_t} + \overline{y}= (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})' \cdot \beta </tex>.
 +
Данная модель уже не зависит от эффектов <tex>\alpha_i \cdot \gamma_t</tex>.
 +
 +
=== Оценка параметров модели ===
 +
 +
Применяя обычный [[метод наименьших квадратов]] к уравнению {{eqref|5}}, можно получить оценки
 +
::<tex>\widehat{\beta} = \left((x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (y_{it} - \overline{y_i} - \overline{y_t} + \overline{y})</tex>.
 +
 +
== Сравнение с другими моделями ==
 +
Заметим, что если в рассмотренной модели все коэффициенты <tex> \gamma_t = 1 (t = 1,...,T)</tex>, то получим [[Модель панельных данных с фиксированными эффектами]]. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить гипотезу <tex>\mathbb{H}_0:\gamma_1 = ... = \gamma_T = 1 </tex> . Обычно для этого используют [[тест Фишера| F-тест]].
 +
 +
== Проблемы ==
 +
 +
Для устойчивости данной модели необхоимо, чтобы значения <tex>\gamma_t</tex> изменялись плавно. Для этого используют регуляризацию:
 +
::<tex>\sum_{i=1}^n \sum_{t=1}^T( \widehat{y}_{it} - y_{it} )^2 + \lambda \sum_{t=2}^T( \gamma_t - \gamma_{t-1} )^2 \longrightarrow \underset{\alpha, \beta , \gamma} \min</tex>
 +
 +
Тогда, чем больше значение <tex>\lambda</tex>, тем более гладко изменяется <tex> \gamma_t </tex>. Для выбора значения <tex>\lambda</tex> можно использовать метод [[скользящий контроль|скользящего контроля]].
 +
== Литература ==
== Литература ==
 +
# {{книга
 +
|автор = Магнус Я. Р., Катышев П. К., Пересецкий А. А.
 +
|заглавие = Эконометрика. Начальный курс
 +
|издательство = М.: Дело
 +
|год = 2004
 +
|страниц = 576
 +
}}
== См. также ==
== См. также ==
 +
* [[Объединённая модель панельных данных]]
 +
* [[Модель панельных данных со случайными эффектами]]
 +
* [[Модель панельных данных с фиксированными эффектами]]
 +
* [[Ротационная панель]]
== Ссылки ==
== Ссылки ==
-
 
+
* [http://en.wikipedia.org/wiki/Panel_data Panel data] (Wikipedia)
-
{{Stub|}}
+
* [https://editorialexpress.com/cgi-bin/conference/download.cgi?db_name=ESAM07&paper_id=211 Flexible Estimation of Stochastic Frontiers Time Varying Panel Data Models]
[[Категория: Прикладная статистика]]
[[Категория: Прикладная статистика]]
 +
[[Категория:Анализ панельных данных]]

Версия 19:03, 22 января 2009

Модель панельных данных с временны́ми эффектами ( time-varying model for panel data) опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются эффектами. В данной модели эффекты объектов могут изменяться в каждый момент времени.

Содержание

Обозначения

Введем обозначения:

  •  i = 1,...,n – номера объектов, t = 1,...,T – моменты времени, k – число признаков.

Для каждого объекта в каждый момент времени известны:

  •  x_{it} – набор независимых переменных (вектор размерности k )
  •  y_{it} – зависимая переменная для экономической единицы i в момент времени t

Описание модели панельных данных с временны́ми эффектами

В введенных обозначениях модель панельных данных с с временны́ми эффектами описывается уравнением

(1)
 \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta

Здесь \widehat{y}_{it} модельное значение зависимой переменной, соответствующее {y}_{it}. Величина \alpha_i выражает индивидуальный эффект объекта  i, не зависящий от времени t . Величина \gamma_t выражает зависимость индивидуального эффекта объекта  i от времени t ( будем считать, что всегда \gamma_1 = 1 ). При этом регрессоры  x_{it}  не содержат константу .

Параметры модели: \beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n), \gamma_t \in \mathbb{R} (i=2,...,T).

Понижение размерности. Исключение эффектов.

Для панельных данных типична ситуация, когда число объектов  n достаточно велико. Поэтому, применяя непосредственно метод наименьших квадратов к уравнению (1), при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты \alpha_i \cdot \gamma_t. При этом мы понижаем размерность задачи с (n+k+T-1) до  k .

Наиболее простой способ – переход в уравнении (1) к средним величинам по времени и по множеству объектов :

(2)
\overline{y_i}= \alpha_i + \overline{\gamma} + \overline{x'_i} \cdot \beta ,

где \overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\;  \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\;  \overline{\gamma} = \frac{1}{T} \sum_{t=1}^T \gamma_t;

(3)
\overline{y_t}= \overline{\alpha} + \gamma_t + \overline{x'_t} \cdot \beta ,

где \overline{y_t} = \frac{1}{n} \sum_{i=1}^n y_{it},\;  \overline{x_t} = \frac{1}{n} \sum_{i=1}^n x_{it},\;  \overline{\alpha} = \frac{1}{n} \sum_{i=1}^n \alpha_i

(4)
\overline{y}= \overline{\alpha} + \overline{\gamma} + \overline{x'} \cdot \beta ,

где \overline{y} = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T y_{it},\;  \overline{x} = \frac{1}{nT} \sum_{i=1}^n\sum_{t=1}^T x_{it},\;


Из (1),(2),(3),(4) получаем:

(5)
 \widehat{y}_{it} - \overline{y_i} - \overline{y_t} + \overline{y}= (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})' \cdot \beta .

Данная модель уже не зависит от эффектов \alpha_i \cdot \gamma_t.

Оценка параметров модели

Применяя обычный метод наименьших квадратов к уравнению (5), можно получить оценки

\widehat{\beta} = \left((x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (y_{it} - \overline{y_i} - \overline{y_t} + \overline{y}).

Сравнение с другими моделями

Заметим, что если в рассмотренной модели все коэффициенты  \gamma_t = 1 (t = 1,...,T), то получим Модель панельных данных с фиксированными эффектами. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить гипотезу \mathbb{H}_0:\gamma_1 = ... = \gamma_T = 1 . Обычно для этого используют F-тест.

Проблемы

Для устойчивости данной модели необхоимо, чтобы значения \gamma_t изменялись плавно. Для этого используют регуляризацию:

\sum_{i=1}^n \sum_{t=1}^T( \widehat{y}_{it} - y_{it} )^2 + \lambda \sum_{t=2}^T( \gamma_t - \gamma_{t-1} )^2 \longrightarrow \underset{\alpha, \beta , \gamma} \min

Тогда, чем больше значение \lambda, тем более гладко изменяется  \gamma_t . Для выбора значения \lambda можно использовать метод скользящего контроля.

Литература

  1. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.

См. также

Ссылки

Личные инструменты