Ковариационный анализ
Материал из MachineLearning.
(Новая: Скоро здесь будет статья!) |
|||
Строка 1: | Строка 1: | ||
- | + | '''Ковариационный анализ''' - совокупность методов математической статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины <tex>Y</tex> одновременно от набора количественных факторов <tex>X</tex> и неколичественных факторов <tex>F</tex>. По отношению к <tex>Y</tex> переменные <tex>X</tex> называются сопутствующими. Факторы <tex>F</tex> задают сочетания условий качественной природы, при которых были получены наблюдения <tex>Y</tex> и <tex>X</tex>, и описываются с помощью так называемых индикаторных переменных, причем среди сопутствующих и индикаторных переменных могут быть как случайные, так и неслучайные (контролируемые в эксперименте). | |
+ | |||
+ | Если случайная величина <tex>Y</tex> является вектором, то говорят о ''многомерном ковариационном анализе''. | ||
+ | == Постановка задачи == | ||
+ | Основные теоретические и прикладные проблемы ковариационного анализа относятся к линейным моделям. В частности, если анализируются <tex>n</tex> наблюдений <tex>Y_1,...,Y_n</tex> с <tex>p</tex> сопутствующими переменными <tex>(X=(x^{(1)},...,x^{(p)}))</tex>, <tex>k</tex> возможными типами условий эксперимента <tex>(F=(f_1,...,f_k))</tex>, то линейная модель соответствующего ковариационного анализа задается уравнением: | ||
+ | ::<tex>Y_i=\sum\limits_{j=1}^k{f_{ij}\theta_j} + \sum\limits_{j=1}^p{\beta_s(f_i)x_i^{(1)} + \eps_i(f_i)}</tex> | ||
+ | где <tex>i=1,...,n</tex>, индикаторные переменные <tex>f_{ij}</tex> равны 1, если j-е условие эксперимента имело место при наблюдении <tex>Y_i</tex>, и равны 0 в противном случае. Коэффициенты <tex>\theta_j</tex> определяют эффект влияния j-го условия, <tex>x_i^s</tex> - значение сопутствующей переменной <tex>x^{(s)}</tex>, при котором получено наблюдение <tex>Y_i</tex>. <tex>\beta_s(f_i)</tex> - значения соответствующих коэффициентов регрессии <tex>Y</tex> по <tex>x^{(s)}</tex>, <tex>\eps_i(f_i)</tex> - случайные ошибки с нулевым математическим ожиданием. | ||
+ | |||
+ | Основное назначение ковариационного анализа - использование в построении статистических оценок <tex>\theta_1,...,\theta_k</tex>; <tex>\beta_1,...,\beta_p</tex> и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели постулировать априори <tex>\beta_1=...=\beta_p=0</tex>, то получится модель ''дисперсионного анализа'', если же исключить влияние неколичественных факторов (положить <tex>\theta_1=...=\theta_k=0</tex>), то получится модель регрессионного анализа. | ||
+ | |||
+ | == Литература == | ||
+ | # ''Кендалл М.Дж., Стьюарт А.'' Многомерный статистический анализ и временные ряды. — М., 1976. | ||
+ | # ''Шеффе Г.'' Дисперсионный анализ. — М., 1980. | ||
+ | |||
+ | [[Категория:Дисперсионный анализ]] |
Версия 16:32, 9 января 2009
Ковариационный анализ - совокупность методов математической статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины одновременно от набора количественных факторов и неколичественных факторов . По отношению к переменные называются сопутствующими. Факторы задают сочетания условий качественной природы, при которых были получены наблюдения и , и описываются с помощью так называемых индикаторных переменных, причем среди сопутствующих и индикаторных переменных могут быть как случайные, так и неслучайные (контролируемые в эксперименте).
Если случайная величина является вектором, то говорят о многомерном ковариационном анализе.
Постановка задачи
Основные теоретические и прикладные проблемы ковариационного анализа относятся к линейным моделям. В частности, если анализируются наблюдений с сопутствующими переменными , возможными типами условий эксперимента , то линейная модель соответствующего ковариационного анализа задается уравнением:
где , индикаторные переменные равны 1, если j-е условие эксперимента имело место при наблюдении , и равны 0 в противном случае. Коэффициенты определяют эффект влияния j-го условия, - значение сопутствующей переменной , при котором получено наблюдение . - значения соответствующих коэффициентов регрессии по , - случайные ошибки с нулевым математическим ожиданием.
Основное назначение ковариационного анализа - использование в построении статистических оценок ; и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели постулировать априори , то получится модель дисперсионного анализа, если же исключить влияние неколичественных факторов (положить ), то получится модель регрессионного анализа.
Литература
- Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. — М., 1976.
- Шеффе Г. Дисперсионный анализ. — М., 1980.