Участник:Artur

Материал из MachineLearning.

Перейти к: навигация, поиск

Обзор статьи “Combining multivariate density forecasts using predictive criteria”

Основная задача этой статьи - построить линейные комбинации прогнозов полности для инфляции, процентных ставок на определенном наборе моделей. Авторы предлагают рассмотреть 3 модели, каждая из которых дает точечные многомерные прогнозы: BVAR, FAVAR, DSGE.

  1. BVAR – Байесовская векторная авторегрессия. Модель задается следующим выражением:
y_t = \sum_{n=0}^\p A_i y_{t-i} + B + \varepsilon_t,

где B-вектор констант, \varepsilon_t \in N(0,\Sigma).

Данная модель рассматривается с числом лагов p=2,3,4.

  1. FAVAR - дополненная факторами векторная регрессия.
  2. DSGE.

Построение плотности прогноза для каждой модели одинаково. Выполняется это следующим образом: путем итераций на каждом шаге строится величина z_{k,t+h} по следующим формулам:

y_{k,t}=A_k y_{k,t-1} + C_k u_{k,t}
z_{k.t}=D_k y_{k,t} + v_{k,t}

A,C, D-матрицы, которые зависят от формы модели.

Авторы предлагают на каждом шаге в качестве u_{k,t+h} брать нормальное распределение с нулевым математическим ожиданием и некоторой постоянной дисперсией (в одномерном случае). Повторение процедуры 1000 раз позволяет нам получить картину распределения вероятности прогноза.

Предлагаются варианты построения взвешенной линейной комбинации прогнозов плотности каждой рассматриваемых моделей модели (не совсем понятно как складывать плотности, авторы не заостряют на этом внимания!):

p_t(z_t+h)=\sum_{k=1}^\K p_t(z_{k,t+h})w_{k,h}
,

Авторы определяют веса 3 различными способами:

  1. Обычное среднее;
  2. Байесовский подход. Веса моделей могут быть вычислены по следующей формуле:
w_k=(p(y_k) p(M_k))/(\sum_{i=1}^\K p(y_i) p(M_i)), где
p(M_k)=1/K,  p(y_k) - "граничная" вероятность каждой модели
  1. Метод PL (Predictive-likelihood weighs). Необходимо разделить доступные данные на две выборки. «Обучаемая» выборка используется для оценивания параметров каждой модели, «решающая» выборка используется, чтобы оценить вклад каждой модели в прогноз. На практике необходимо найти компромисс между «обучаемой» и «решающей» выборкой. Веса рассчитываются аналогично байесовскому подходу, только вместо маргинальной вероятности берется следующее выражение:
PL_{k,h}=p(z_{k,h,hold-out}|y_{k,training}=p(z_{k,l+h}|y_{k,t})...p(z_{k,T}|y_{k,t})

и веса подсчитываются следующим образом:

w_k=(PL_{k,h} p(M_k))/(\sum_{i=1}^\K PL_{i,h} p(M_i)), где
p(M_k)=1/K

Авторы строят линейную комбинацию из 13 прогнозов плотности различных моделей, которые представляют различные модификации 3 основных моделей данной статьи: BVAR, FAVAR, DSGE. Приводится графическое сравнение прогнозов плотности построенной линейной комбинации, обычного среднего, и 3 основных моделей в отдельности. При оценивания плотности прогнозов авторы избегают необходимости построения неизвестной точной плотности прогноза или определения некоторой функции потерь, а используют подход Диаболда (probability integral transforms).

Авторы пришли к следующим выводам:



Обзор статьи "Density Forecasting: A Survey"

Основная задача данной статьи – провести краткий обзор прогнозирования плотности. Авторы статьи определяют понятие прогнозирование плотности, приводят примеры. Приводится объяснение того, почему наиболее разумно использовать прогноз плотности или эмпирического распределения, а не точечный прогноз или построение доверительного интервала.

Авторы рассказывают историю появления прогнозирования плотности и его использование в макроэкономике и финансах. Для макроэкономики приводится пример построения непрырывной функции распределения для кусочной функции распределения, состоящей из двух частей, каждая из которой представляет нормальное распределение. В финансах обсуждается возможность прогнозирования неустойчивости, перекоса (skew) и эксцесса (kurtosis).

Большое внимание уделяется представлению прогнозирования плотности: некоторые способы представления могут скрывать одни особенности прогноза, и, наоборот, акцентировать внимание на другие. Авторы выделяют три способа представления: аналитический (при помощи алгебраических выражений), графический и с помощью таблиц.

Наиболее главным моментом этой статьи является оценивание плотности прогноза. В отличие от точного прогноза, при оценивании плотности прогноза очень трудно определить соответствующую функцию потерь. Поэтому авторы статьи используют подход Диаболда (Diebold), который оценивает прогноз без необходимости определения функции потерь. Суть этого метода заключается в следующем: последовательность оцениваемых прогнозов плотности p_{t}(y_{t}), t=1,...,T для реализации некоторого процесса y_{t}, t=1,...,T совпадает с настоящей плотностью f_{t}(y_{t}), t=1,..,T если последовательность probability integral transforms (вероятностных интегральных преобразований) z_{t}, t=1,...,T является независимыми одинаково распределенными, с равномерным распределением на отрезке [0;1].

место для интеграла:) z_{t}=∫p_{t}(u)du; t=1,...,T

Таким образом, прогноз плотности является оптимальным и охватывает все аспекты распределения y_{t}, только если z_{t} являются независимыми одинаковораспределенными случайными величинами с равномерным распределением на отрезке [0;1]. В других статьях ([1]) также показано, что подход Диаболда может быть расширен и на многомерный случай.

Личные инструменты