Модель панельных данных с временны́ми эффектами
Материал из MachineLearning.
(Новая: == Литература == == См. также == == Ссылки == {{Stub|}} Категория: Прикладная статистика) |
м (→Описание модели панельных данных с временны́ми эффектами) |
||
(4 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
+ | '''Модель панельных данных с временны́ми эффектами ''' (''''' time-varying model for panel data''''') опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются '''эффектами'''. В данной модели эффекты объектов могут изменяться в каждый момент времени. | ||
+ | |||
+ | == Обозначения == | ||
+ | Введем обозначения: | ||
+ | * <tex> i = 1,...,n</tex> – номера объектов, <tex>t = 1,...,T</tex> – моменты времени, <tex>k </tex> – число признаков. | ||
+ | Для каждого объекта в каждый момент времени известны: | ||
+ | * <tex> x_{it}</tex> – набор независимых переменных (вектор размерности <tex>k </tex>) | ||
+ | * <tex> y_{it}</tex> – зависимая переменная для экономической единицы <tex>i</tex> в момент времени <tex>t</tex> | ||
+ | |||
+ | == Описание модели панельных данных с временны́ми эффектами == | ||
+ | В введенных обозначениях '''модель панельных данных с временны́ми эффектами ''' описывается уравнением | ||
+ | {{eqno|1}} | ||
+ | ::<tex> \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta </tex> | ||
+ | |||
+ | Здесь <tex>\widehat{y}_{it}</tex> модельное значение зависимой переменной, соответствующее <tex>{y}_{it}</tex>. | ||
+ | Величина <tex>\alpha_i</tex> выражает индивидуальный эффект объекта <tex> i</tex>, не зависящий от времени <tex>t </tex>. | ||
+ | Величина <tex>\gamma_t</tex> выражает зависимость индивидуального эффекта объекта <tex> i</tex> от времени <tex>t </tex> ( будем считать, что всегда <tex>\gamma_1 = 1 </tex> ). | ||
+ | ''При этом регрессоры <tex> x_{it} </tex> не содержат константу ''. | ||
+ | |||
+ | '''Параметры модели''': <tex>\beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n), \gamma_t \in \mathbb{R} (i=2,...,T)</tex>. | ||
+ | |||
+ | === Понижение размерности. Исключение эффектов. === | ||
+ | Для панельных данных типична ситуация, когда число объектов <tex> n</tex> достаточно велико. Поэтому, применяя непосредственно [[метод наименьших квадратов]] к уравнению {{eqref|1}}, при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты <tex>\alpha_i \cdot \gamma_t</tex>. При этом мы ''понижаем размерность задачи с <tex>(n+k+T-1)</tex> до <tex> k</tex> ''. | ||
+ | |||
+ | Наиболее простой способ – переход в уравнении {{eqref|1}} к средним величинам по времени и по множеству объектов : | ||
+ | {{eqno|2}} | ||
+ | ::<tex>\overline{y_i}= \alpha_i + \overline{\gamma} + \overline{x'_i} \cdot \beta </tex> , | ||
+ | где <tex>\overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\; \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\; \overline{\gamma} = \frac{1}{T} \sum_{t=1}^T \gamma_t</tex>; | ||
+ | {{eqno|3}} | ||
+ | ::<tex>\overline{y_t}= \overline{\alpha} + \gamma_t + \overline{x'_t} \cdot \beta </tex> , | ||
+ | где <tex>\overline{y_t} = \frac{1}{n} \sum_{i=1}^n y_{it},\; \overline{x_t} = \frac{1}{n} \sum_{i=1}^n x_{it},\; \overline{\alpha} = \frac{1}{n} \sum_{i=1}^n \alpha_i</tex> | ||
+ | |||
+ | {{eqno|4}} | ||
+ | ::<tex>\overline{y}= \overline{\alpha} + \overline{\gamma} + \overline{x'} \cdot \beta </tex> , | ||
+ | где <tex>\overline{y} = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T y_{it},\; \overline{x} = \frac{1}{nT} \sum_{i=1}^n\sum_{t=1}^T x_{it},\; </tex> | ||
+ | |||
+ | |||
+ | Из {{eqref|1}},{{eqref|2}},{{eqref|3}},{{eqref|4}} получаем: | ||
+ | {{eqno|5}} | ||
+ | ::<tex> \widehat{y}_{it} - \overline{y_i} - \overline{y_t} + \overline{y}= (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})' \cdot \beta </tex>. | ||
+ | Данная модель уже не зависит от эффектов <tex>\alpha_i \cdot \gamma_t</tex>. | ||
+ | |||
+ | === Оценка параметров модели === | ||
+ | |||
+ | Применяя обычный [[метод наименьших квадратов]] к уравнению {{eqref|5}}, можно получить оценки | ||
+ | ::<tex>\widehat{\beta} = \left((x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (y_{it} - \overline{y_i} - \overline{y_t} + \overline{y})</tex>. | ||
+ | |||
+ | == Сравнение с другими моделями == | ||
+ | Заметим, что если в рассмотренной модели все коэффициенты <tex> \gamma_t = 1 (t = 1,...,T)</tex>, то получим [[Модель панельных данных с фиксированными эффектами]]. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить [[Нулевая гипотеза|гипотезу]] <tex>\mathbb{H}_0:\gamma_1 = ... = \gamma_T = 1 </tex> . Обычно для этого используют [[тест Фишера| F-тест]]. | ||
+ | |||
+ | == Проблемы == | ||
+ | |||
+ | Для устойчивости данной модели необхоимо, чтобы значения <tex>\gamma_t</tex> изменялись плавно. Для этого используют регуляризацию: | ||
+ | ::<tex>\sum_{i=1}^n \sum_{t=1}^T( \widehat{y}_{it} - y_{it} )^2 + \lambda \sum_{t=2}^T( \gamma_t - \gamma_{t-1} )^2 \longrightarrow \underset{\alpha, \beta , \gamma} \min</tex> | ||
+ | |||
+ | Тогда, чем больше значение <tex>\lambda</tex>, тем более гладко изменяется <tex> \gamma_t </tex>. Для выбора значения <tex>\lambda</tex> можно использовать метод [[скользящий контроль|скользящего контроля]]. | ||
+ | |||
== Литература == | == Литература == | ||
+ | # {{книга | ||
+ | |автор = Магнус Я. Р., Катышев П. К., Пересецкий А. А. | ||
+ | |заглавие = Эконометрика. Начальный курс | ||
+ | |издательство = М.: Дело | ||
+ | |год = 2004 | ||
+ | |страниц = 576 | ||
+ | }} | ||
== См. также == | == См. также == | ||
+ | * [[Объединённая модель панельных данных]] | ||
+ | * [[Модель панельных данных со случайными эффектами]] | ||
+ | * [[Модель панельных данных с фиксированными эффектами]] | ||
+ | * [[Ротационная панель]] | ||
== Ссылки == | == Ссылки == | ||
- | + | * [http://en.wikipedia.org/wiki/Panel_data Panel data] (Wikipedia) | |
- | + | * [https://editorialexpress.com/cgi-bin/conference/download.cgi?db_name=ESAM07&paper_id=211 Flexible Estimation of Stochastic Frontiers Time Varying Panel Data Models] | |
[[Категория: Прикладная статистика]] | [[Категория: Прикладная статистика]] | ||
+ | [[Категория:Анализ панельных данных]] | ||
+ | [[Категория: Энциклопедия анализа данных]] | ||
+ | |||
+ | {{UnderConstruction|[[Участник:Валентина Федорова|Валентина Федорова]] 23:52, 22 января 2009 (MSK)}} | ||
+ | {{Stub|}} |
Текущая версия
Модель панельных данных с временны́ми эффектами ( time-varying model for panel data) опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются эффектами. В данной модели эффекты объектов могут изменяться в каждый момент времени.
Содержание |
Обозначения
Введем обозначения:
- – номера объектов, – моменты времени, – число признаков.
Для каждого объекта в каждый момент времени известны:
- – набор независимых переменных (вектор размерности )
- – зависимая переменная для экономической единицы в момент времени
Описание модели панельных данных с временны́ми эффектами
В введенных обозначениях модель панельных данных с временны́ми эффектами описывается уравнением
Здесь модельное значение зависимой переменной, соответствующее . Величина выражает индивидуальный эффект объекта , не зависящий от времени . Величина выражает зависимость индивидуального эффекта объекта от времени ( будем считать, что всегда ). При этом регрессоры не содержат константу .
Параметры модели: .
Понижение размерности. Исключение эффектов.
Для панельных данных типична ситуация, когда число объектов достаточно велико. Поэтому, применяя непосредственно метод наименьших квадратов к уравнению (1), при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты . При этом мы понижаем размерность задачи с до .
Наиболее простой способ – переход в уравнении (1) к средним величинам по времени и по множеству объектов :
- ,
где ;
- ,
где
- ,
где
- .
Данная модель уже не зависит от эффектов .
Оценка параметров модели
Применяя обычный метод наименьших квадратов к уравнению (5), можно получить оценки
- .
Сравнение с другими моделями
Заметим, что если в рассмотренной модели все коэффициенты , то получим Модель панельных данных с фиксированными эффектами. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить гипотезу . Обычно для этого используют F-тест.
Проблемы
Для устойчивости данной модели необхоимо, чтобы значения изменялись плавно. Для этого используют регуляризацию:
Тогда, чем больше значение , тем более гладко изменяется . Для выбора значения можно использовать метод скользящего контроля.
Литература
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.
См. также
- Объединённая модель панельных данных
- Модель панельных данных со случайными эффектами
- Модель панельных данных с фиксированными эффектами
- Ротационная панель
Ссылки
Статья в настоящий момент дорабатывается. Валентина Федорова 23:52, 22 января 2009 (MSK) |