Модель панельных данных с временны́ми эффектами

Материал из MachineLearning.

(Различия между версиями)

Версия 19:03, 22 января 2009

Модель панельных данных с временны́ми эффектами ( time-varying model for panel data) опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются эффектами. В данной модели эффекты объектов могут изменяться в каждый момент времени.

Содержание

1 Обозначения
2 Описание модели панельных данных с временны́ми эффектами
- 2.1 Понижение размерности. Исключение эффектов.
- 2.2 Оценка параметров модели
3 Сравнение с другими моделями
4 Проблемы
5 Литература
6 См. также
7 Ссылки

Обозначения

Введем обозначения:

$i = 1,...,n$ – номера объектов, $t = 1,...,T$ – моменты времени, $k$ – число признаков.

Для каждого объекта в каждый момент времени известны:

$x_{it}$ – набор независимых переменных (вектор размерности $k$ )
$y_{it}$ – зависимая переменная для экономической единицы $i$ в момент времени $t$

Описание модели панельных данных с временны́ми эффектами

В введенных обозначениях модель панельных данных с с временны́ми эффектами описывается уравнением

(1)

$\widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta$

Здесь $\widehat{y}_{it}$ модельное значение зависимой переменной, соответствующее ${y}_{it}$ . Величина $\alpha_i$ выражает индивидуальный эффект объекта $i$ , не зависящий от времени $t$ . Величина $\gamma_t$ выражает зависимость индивидуального эффекта объекта $i$ от времени $t$ ( будем считать, что всегда $\gamma_1 = 1$ ). При этом регрессоры $x_{it}$ не содержат константу .

Параметры модели: $\beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n), \gamma_t \in \mathbb{R} (i=2,...,T)$ .

Понижение размерности. Исключение эффектов.

Для панельных данных типична ситуация, когда число объектов $n$ достаточно велико. Поэтому, применяя непосредственно метод наименьших квадратов к уравнению (1), при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты $\alpha_i \cdot \gamma_t$ . При этом мы понижаем размерность задачи с $(n+k+T-1)$ до $k$ .

Наиболее простой способ – переход в уравнении (1) к средним величинам по времени и по множеству объектов :

(2)

$\overline{y_i}= \alpha_i + \overline{\gamma} + \overline{x'_i} \cdot \beta$ ,

где $\overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\; \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\; \overline{\gamma} = \frac{1}{T} \sum_{t=1}^T \gamma_t$ ;

(3)

$\overline{y_t}= \overline{\alpha} + \gamma_t + \overline{x'_t} \cdot \beta$ ,

где $\overline{y_t} = \frac{1}{n} \sum_{i=1}^n y_{it},\; \overline{x_t} = \frac{1}{n} \sum_{i=1}^n x_{it},\; \overline{\alpha} = \frac{1}{n} \sum_{i=1}^n \alpha_i$

(4)

$\overline{y}= \overline{\alpha} + \overline{\gamma} + \overline{x'} \cdot \beta$ ,

где $\overline{y} = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T y_{it},\; \overline{x} = \frac{1}{nT} \sum_{i=1}^n\sum_{t=1}^T x_{it},\;$

Из (1),(2),(3),(4) получаем:

(5)

$\widehat{y}_{it} - \overline{y_i} - \overline{y_t} + \overline{y}= (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})' \cdot \beta$ .

Данная модель уже не зависит от эффектов $\alpha_i \cdot \gamma_t$ .

Оценка параметров модели

Применяя обычный метод наименьших квадратов к уравнению (5), можно получить оценки

$\widehat{\beta} = \left((x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (y_{it} - \overline{y_i} - \overline{y_t} + \overline{y})$ .

Сравнение с другими моделями

Заметим, что если в рассмотренной модели все коэффициенты $\gamma_t = 1 (t = 1,...,T)$ , то получим Модель панельных данных с фиксированными эффектами. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить гипотезу $\mathbb{H}_0:\gamma_1 = ... = \gamma_T = 1$ . Обычно для этого используют F-тест.

Проблемы

Для устойчивости данной модели необхоимо, чтобы значения $\gamma_t$ изменялись плавно. Для этого используют регуляризацию:

$\sum_{i=1}^n \sum_{t=1}^T( \widehat{y}_{it} - y_{it} )^2 + \lambda \sum_{t=2}^T( \gamma_t - \gamma_{t-1} )^2 \longrightarrow \underset{\alpha, \beta , \gamma} \min$

Тогда, чем больше значение $\lambda$ , тем более гладко изменяется $\gamma_t$ . Для выбора значения $\lambda$ можно использовать метод скользящего контроля.

Литература

Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.

См. также

Ссылки

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9C%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BF%D0%B0%D0%BD%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D1%81_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%CC%81%D0%BC%D0%B8_%D1%8D%D1%84%D1%84%D0%B5%D0%BA%D1%82%D0%B0%D0%BC%D0%B8»

Категории: Прикладная статистика | Анализ панельных данных

@@ Строка 1: / Строка 1: @@
+'''Модель панельных данных с временны́ми эффектами ''' (''''' time-varying model for panel data''''') опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются '''эффектами'''. В данной модели эффекты объектов могут изменяться в каждый момент времени.
+== Обозначения ==
+Введем обозначения:
+* <tex> i = 1,...,n</tex> – номера объектов, <tex>t = 1,...,T</tex>  – моменты времени, <tex>k </tex> – число признаков.
+Для каждого объекта в каждый момент времени известны:
+* <tex> x_{it}</tex>  – набор независимых переменных (вектор размерности <tex>k </tex>)
+* <tex> y_{it}</tex>  – зависимая переменная для экономической единицы <tex>i</tex> в момент времени <tex>t</tex>
+== Описание модели панельных данных с временны́ми эффектами ==
+В введенных обозначениях '''модель панельных данных с с временны́ми эффектами ''' описывается уравнением
+{{eqno|1}}
+::<tex> \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta </tex>
+Здесь <tex>\widehat{y}_{it}</tex> модельное значение зависимой переменной, соответствующее <tex>{y}_{it}</tex>.
+Величина <tex>\alpha_i</tex> выражает индивидуальный эффект объекта <tex> i</tex>, не зависящий от времени <tex>t </tex>.
+Величина <tex>\gamma_t</tex> выражает зависимость индивидуального эффекта объекта <tex> i</tex> от времени <tex>t </tex> ( будем считать, что всегда <tex>\gamma_1 = 1 </tex> ).
+''При этом регрессоры <tex> x_{it}  </tex> не содержат константу ''.
+'''Параметры модели''': <tex>\beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n), \gamma_t \in \mathbb{R} (i=2,...,T)</tex>.
+=== Понижение размерности. Исключение эффектов. ===
+Для панельных данных типична ситуация, когда число объектов <tex> n</tex> достаточно велико. Поэтому, применяя непосредственно [[метод наименьших квадратов]] к уравнению {{eqref|1}}, при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты <tex>\alpha_i \cdot \gamma_t</tex>. При этом мы ''понижаем размерность задачи с <tex>(n+k+T-1)</tex>  до <tex> k</tex> ''.
+Наиболее простой способ – переход в уравнении {{eqref|1}} к средним величинам по времени и по множеству объектов :
+{{eqno|2}}
+::<tex>\overline{y_i}= \alpha_i + \overline{\gamma} + \overline{x'_i} \cdot \beta </tex> ,
+где <tex>\overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\;  \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\;  \overline{\gamma} = \frac{1}{T} \sum_{t=1}^T \gamma_t</tex>;
+{{eqno|3}}
+::<tex>\overline{y_t}= \overline{\alpha} + \gamma_t + \overline{x'_t} \cdot \beta </tex> ,
+где <tex>\overline{y_t} = \frac{1}{n} \sum_{i=1}^n y_{it},\;  \overline{x_t} = \frac{1}{n} \sum_{i=1}^n x_{it},\;  \overline{\alpha} = \frac{1}{n} \sum_{i=1}^n \alpha_i</tex>
+{{eqno|4}}
+::<tex>\overline{y}= \overline{\alpha} + \overline{\gamma} + \overline{x'} \cdot \beta </tex> ,
+где <tex>\overline{y} = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T y_{it},\;  \overline{x} = \frac{1}{nT} \sum_{i=1}^n\sum_{t=1}^T x_{it},\;  </tex>
+Из {{eqref|1}},{{eqref|2}},{{eqref|3}},{{eqref|4}} получаем:
+{{eqno|5}}
+::<tex> \widehat{y}_{it} - \overline{y_i} - \overline{y_t} + \overline{y}= (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})' \cdot \beta </tex>.
+Данная модель уже не зависит от эффектов <tex>\alpha_i \cdot \gamma_t</tex>.
+=== Оценка параметров модели ===
+Применяя обычный [[метод наименьших квадратов]] к уравнению {{eqref|5}}, можно получить оценки
+::<tex>\widehat{\beta} = \left((x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (y_{it} - \overline{y_i} - \overline{y_t} + \overline{y})</tex>.
+== Сравнение с другими моделями ==
+Заметим, что если в рассмотренной модели все коэффициенты <tex> \gamma_t = 1 (t = 1,...,T)</tex>, то получим [[Модель панельных данных с фиксированными эффектами]]. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить гипотезу <tex>\mathbb{H}_0:\gamma_1 = ... = \gamma_T = 1 </tex> . Обычно для этого используют [[тест Фишера| F-тест]].
+== Проблемы ==
+Для устойчивости данной модели необхоимо, чтобы значения <tex>\gamma_t</tex> изменялись плавно. Для этого используют регуляризацию:
+::<tex>\sum_{i=1}^n \sum_{t=1}^T( \widehat{y}_{it} - y_{it} )^2 + \lambda \sum_{t=2}^T( \gamma_t - \gamma_{t-1} )^2 \longrightarrow \underset{\alpha, \beta , \gamma} \min</tex>
+Тогда, чем больше значение <tex>\lambda</tex>, тем более гладко изменяется <tex> \gamma_t </tex>. Для выбора значения <tex>\lambda</tex> можно использовать метод [[скользящий контроль|скользящего контроля]].
 == Литература ==
+# {{книга
+|автор        = Магнус Я. Р., Катышев П. К., Пересецкий А. А.
+|заглавие     = Эконометрика. Начальный курс
+|издательство = М.: Дело
+|год          = 2004
+|страниц      = 576
+}}
 == См. также ==
+* [[Объединённая модель панельных данных]]
+* [[Модель панельных данных со случайными эффектами]]
+* [[Модель панельных данных с фиксированными эффектами]]
+* [[Ротационная панель]]
 == Ссылки ==
+* [http://en.wikipedia.org/wiki/Panel_data  Panel data] (Wikipedia)
-{{Stub|}}
+* [https://editorialexpress.com/cgi-bin/conference/download.cgi?db_name=ESAM07&paper_id=211 Flexible Estimation of Stochastic Frontiers Time Varying Panel Data Models]
 [[Категория: Прикладная статистика]]
+[[Категория:Анализ панельных данных]]