Модель панельных данных с фиксированными эффектами

Материал из MachineLearning.

Перейти к: навигация, поиск

Модель панельных данных с фиксированными эффектами ( fixed effect model) опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются эффектами. В данной модели эффекты интерпретируются как мешающий параметр, и оценивание направлено на то, чтобы их исключить.

Содержание

Обозначения

Введем обозначения:

  •  i = 1,...,n – номера объектов, t = 1,...,T – моменты времени, k – число признаков.
  •  x_{it} – набор независимых переменных (вектор размерности k )
  •  y_{it} – зависимая переменная для экономической единицы i в момент времени t
  •  \varepsilon_{it} – соответствующая ошибка.
  • Обозначим также:
 \begin{equation*} y_i= \left[y_{i1} \\ ...\\  y_{iT} \right] \text{,} \quad X_i= \left[ x'_{i1} \\ ...\\ x'_{iT}  \right] \text{,} \quad \varepsilon_i= \left[ \varepsilon_{i1} \\ ...\\ \varepsilon_{iT} \right]. \end{equation*}
  • Введем также «объединенные» наблюдения и ошибки:
 \begin{equation*} y= \left[ y_1 \\ ...\\ y_n \right] \text{,} \quad X= \left[  X_1 \\ ...\\ X_n \right] \text{,} \quad \varepsilon= \left[  \varepsilon_1 \\ ...\\ \varepsilon_n  \right]. \end{equation*}

Здесь y, \varepsilonnT \times 1 векторы, XnT \times k матрица.

Описание модели панельных данных с фиксированными эффектами

В введенных обозначениях (см. также Объединённая модель панельных данных) модель панельных данных с фиксированными эффектами описывается уравнением

(1)
y_{it} = \alpha_i + x'_{it} \cdot \beta + \varepsilon_{it}.

Величина \alpha_i выражает индивидуальный эффект объекта  i, не зависящий от времени t , при этом регрессоры  x_{it}  не содержат константу .

Параметры модели: \beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n) .

Основные предположения

Предположим, что выполнены следующие условия:

  1. ошибки \varepsilon_{it} некоррелированы между собой по  i и t , \mathbb{E}(\varepsilon_{it}) = 0, \mathbb{V}(\varepsilon_{it}) = \sigma_{\varepsilon }^2;
  2. ошибки \varepsilon_{it} некоррелированы с регрессорами  x_{js} при всех i, j, t, s.

Понижение размерности. Исключение эффектов.

Для панельных данных типична ситуация, когда число объектов  n достаточно велико. Поэтому, применяя непосредственно метод наименьших квадратов к уравнению (1), при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты \alpha_i. При этом мы понижаем размерность задачи с (n+k) до  k .

Наиболее простой способ – переход в уравнении (1) к средним по времени величинам:

(2)
\overline{y_i}= \alpha_i + \overline{x'_i} \cdot \beta + \overline{\varepsilon_i},

где \overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\;  \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\;  \overline{\varepsilon _i} = \frac{1}{T} \sum_{t=1}^T \varepsilon _{it}.

Вычитая почленно (2) из (1), получаем:

(3)
 y_{it} - \overline{y_i}= (x_{it} - \overline{x_i})' \cdot \beta + \varepsilon_{it} - \overline{\varepsilon_i}.

Данная модель уже не зависит от эффектов \alpha_i. По существу, это уравнение (1), записанное в отклонениях от индивидуальных средних по времени.

Оценка параметров модели

Применяя обычный метод наименьших квадратов к уравнению (3), мы получим оценки

(4)
\widehat{\beta} = \left(\sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i}) \cdot (x_{it} - \overline{x_i})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i}) \cdot (y_{it} - \overline{y_i}).

Эти оценки называются внутригрупповыми оценками ( within estimator) или оценками с фиксированным эффектом ( fixed effect estimator).

Условия 1)-2), наложенные на модель, гарантируют несмещённость и состоятельность оценок с фиксированным эффектом.

В качестве оценок индивидуальных эффектов можно взять

\widehat{\alpha_i} = \overline{y_i} - \overline{x'_i} \cdot \widehat{\beta},\;  i  = 1,...,n.

Эти оценки являются несмещёнными и состоятельными для фиксированного  n при  t \rightarrow \infty.

Из формулы (4) вытекает выражение для матрицы ковариации оценки \widehat{\beta}:

V(\widehat{\beta}) = \sigma_{\varepsilon }^2 \left(\sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i}) \cdot (x_{it} - \overline{x_i})'\right)^{-1}.

Как и в обычной линейной модели, в качестве оценки дисперсии \sigma_{\varepsilon }^2 можно взять сумму квадратов остатков регрессии, деленную на число степеней свободы:

\widehat{\sigma_{\varepsilon }}^2 = \frac {\sum_{i=1}^n \sum_{t=1}^T (y_{it} - \overline{y_i} - (x_{it} - \overline{x_i})' \widehat{\beta})^2}{nT-n-k}.

При достаточно слабых условиях регулярности оценки с фиксированным эффектом являются асимптотически нормальными (при  n \rightarrow \infty или при  T \rightarrow \infty), поэтому можно пользоваться стандартными процедурами (t-тесты, F-тесты) для проверки гипотез относительно параметров \beta.

Недостатки модели панельных данных с фиксированными эффектами

В панельных данных среди независимых переменных x_{it} могут быть такие, которые не меняются во времени для каждого объекта. Например, при анализе зарабатной платы в число факторов часто включают пол или расовую принадлежность. Модель с фиксированным эффектом не позволяет идентифицировать соответствующие таким переменным коэффициенты. Формально это объясняется тем, что в уравнении (3) один или несколько регрессоров равны нулю, и, следовательно, метод наименьших квадратов применять нельзя.

Литература

  1. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.
  1. Коленков С.О. Прикладной эконометрический анализ в статистическом пакете Stata. — 2003.

См. также

Ссылки

Личные инструменты