Метод Бокса-Кокса
Материал из MachineLearning.
(Новая: В реальности часто приходится иметь дело со статистическими данными, которые по тем или иным причина...) |
|||
Строка 2: | Строка 2: | ||
==Вид преобразования== | ==Вид преобразования== | ||
- | Для исходной последовательности <tex>y = \{ y_1, \ldots, y_n \}, \quad y_i > 0, \quad i = 1,\ldots,n</tex> однопараметрическое преобразование Бокса-Кокса определяется следующим образом: | + | Для исходной последовательности <tex>y = \{ y_1, \ldots, y_n \}, \quad y_i > 0, \quad i = 1,\ldots,n</tex> однопараметрическое преобразование Бокса-Кокса с параметром <tex>\lambda</tex> определяется следующим образом: |
:<tex> y_i^{\lambda} = \begin{cases}\frac{y_i^\lambda-1}{\lambda},&\text{if } \lambda \neq 0,\\ \log{(y_i)},& \text{if } \lambda = 0.\end{cases}</tex> | :<tex> y_i^{\lambda} = \begin{cases}\frac{y_i^\lambda-1}{\lambda},&\text{if } \lambda \neq 0,\\ \log{(y_i)},& \text{if } \lambda = 0.\end{cases}</tex> | ||
+ | |||
+ | ==Модификации== | ||
+ | |||
+ | Так как исходный метод предполагает работу только с положительными величинами, было предложено несколько модификаций, учитывающих нулевые и отрицательные значения. | ||
+ | |||
+ | Самый очевидный вариант - сдвиг всех значений на константу <tex>\alpha</tex> так, чтобы выполнялось условие <tex>\quad (y_i + \lambda_2)> 0, \quad i = 1,\ldots,n</tex>. После этого преобразование выглядит так: | ||
+ | |||
+ | :<tex> y_i^{\lambda} = \begin{cases}\frac{(y_i+\alpha)^{\lambda}-1}{\lambda},&\text{if } \lambda_1 \neq 0,\\ \log{(y_i+\alpha)},& \text{if } \lambda = 0.\end{cases}</tex> | ||
+ | |||
+ | |||
+ | :<tex>\tau(y_i;\lambda, \alpha) = \begin{cases} \frac{(y_i + \alpha)^\lambda - 1}{\lambda (\operatorname{GM}(y))^{\lambda - 1}}, & \text{if } \lambda\neq 0, \\ \operatorname{GM}(y)\ln(y_i + \alpha), & \text{if } \lambda=0,\end{cases}</tex> | ||
+ | |||
+ | где <tex>\quad \operatorname{GM}(y) = (y_1\cdots y_n)^{1/n}</tex>. | ||
== Ссылки == | == Ссылки == |
Версия 20:38, 28 декабря 2013
В реальности часто приходится иметь дело со статистическими данными, которые по тем или иным причинам не проходят тест на нормальность. В этой ситуации есть два выхода: либо обратиться к непараметрическим методам, либо воспользоваться специальными методами, позволяющими преобразовать исходную «ненормальную статистику» в «нормальную». Среди множества таких методов преобразований одним из лучших (при неизвестном типе распределения) считается преобразование Бокса-Кокса.
Вид преобразования
Для исходной последовательности однопараметрическое преобразование Бокса-Кокса с параметром определяется следующим образом:
Модификации
Так как исходный метод предполагает работу только с положительными величинами, было предложено несколько модификаций, учитывающих нулевые и отрицательные значения.
Самый очевидный вариант - сдвиг всех значений на константу так, чтобы выполнялось условие . После этого преобразование выглядит так:
где .
Ссылки
- Box, Cox (1964) "An Analysis of Transformations"
- Статьи по автоматическому трейдингу и оптимизации стратегий: "Преобразование Бокса-Кокса".
- А.Н. Порунов (2010). "Бокс-Кокс преобразование и иллюзия "нормальности" макроэкономического ряда".