Эффективность подготовительных курсов для поступления на ВМК МГУ
Материал из MachineLearning.
(Различия между версиями)
Строка 1: | Строка 1: | ||
==Постановка задачи== | ==Постановка задачи== | ||
- | Проверяется эффективность подготовительных курсов ВМК МГУ в 2008 году (далее ПК) | + | Проверяется эффективность подготовительных курсов ВМК МГУ в 2008 году (далее ПК). |
==Исходные данные== | ==Исходные данные== | ||
{| border=1 cellpadding="12" | {| border=1 cellpadding="12" | ||
Строка 12: | Строка 12: | ||
|219 || 208 | |219 || 208 | ||
|} | |} | ||
+ | Проверять будем гипотезу H<sub>0</sub>:ПК не эффективны. | ||
+ | ==Способ решения== | ||
+ | Решать поставленную задачу будем с помощью анализа таблиц сопряженности. | ||
+ | Основная формула метода: <br> | ||
+ | <tex>X^{2}=n(\sum_{i=1}^{K}\sum_{j=1}^{L}\frac{n_{ij}^{2}}{n_{i}n_{j}}-1)\sim\chi_{(L-1)(K-1)}^{2}</tex>, где <br> | ||
+ | <tex>n_{ij}=\sum_{(x,y)}[x=i][y=j]</tex><br> | ||
+ | <tex>n_{i}=\sum_{j}n_{ij}</tex><br> | ||
+ | <tex>n_{j}=\sum_{i}n_{ij}</tex><br> | ||
+ | <tex>n=\sum_{i}\sum_{j}n_{ij}</tex><br> | ||
+ | В нашем случае, для таблицы 2х2, т.е. когда K=L=2, можно применить упрощенную формулу: <br> | ||
+ | <tex>X^{2}=\frac{n(ad-bc)^{2}}{(a+b)(a+c)(b+d)(c+d)}\sim\chi_{1}</tex>, где<br> | ||
+ | <tex>n=a+b+c+d</tex><br> | ||
+ | {| border=1 cellpadding="6" cellspacing="0" | ||
+ | | | ||
+ | {| | ||
+ | ! || y | ||
+ | |- | ||
+ | ! x | ||
+ | |} | ||
+ | ! 1 || 2 | ||
+ | |- align="center" | ||
+ | ! 1 | ||
+ | |a || b | ||
+ | |- align="center" | ||
+ | ! 2 | ||
+ | |c || d | ||
+ | |}<br> | ||
+ | Тогда для нашей задачи получим <tex>X^{2}=18,491</tex> | ||
+ | [[Изображение:Effective_PK.JPG|Распределение хи-квадрат]] | ||
+ | Значит гипотеза H<sub>0</sub> отвергается, т.е. ПК эффективны для поступления на ВМК МГУ. | ||
+ | ==Литература== | ||
+ | # [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2008]] | ||
==Примечание== | ==Примечание== | ||
<references/> | <references/> | ||
[[Категория:Учебные задачи]] | [[Категория:Учебные задачи]] |
Версия 15:41, 26 декабря 2008
Содержание |
Постановка задачи
Проверяется эффективность подготовительных курсов ВМК МГУ в 2008 году (далее ПК).
Исходные данные
Поступили | Не поступили | |
---|---|---|
Ходили | 106 | 42 |
Не ходили | 219 | 208 |
Проверять будем гипотезу H0:ПК не эффективны.
Способ решения
Решать поставленную задачу будем с помощью анализа таблиц сопряженности.
Основная формула метода:
, где
В нашем случае, для таблицы 2х2, т.е. когда K=L=2, можно применить упрощенную формулу:
, где
| 1 | 2 | |||
---|---|---|---|---|---|
1 | a | b | |||
2 | c | d |
Тогда для нашей задачи получим Значит гипотеза H0 отвергается, т.е. ПК эффективны для поступления на ВМК МГУ.