Участник:Kropotov/Песочница
Материал из MachineLearning.
Строка 70: | Строка 70: | ||
<tex>\begin{align*} &f_1(x) = -1.8-0.1x,&\quad &f_3(x) = 2.2-3.6x,\\ &f_2(x) = -1.2-3.8x,&\quad &f_4(x) = -3.1+4.5x. \end{align*}</tex> | <tex>\begin{align*} &f_1(x) = -1.8-0.1x,&\quad &f_3(x) = 2.2-3.6x,\\ &f_2(x) = -1.2-3.8x,&\quad &f_4(x) = -3.1+4.5x. \end{align*}</tex> | ||
+ | |||
Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов. | Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов. | ||
- | 3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков | + | 3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков <tex>x_1</tex> и <tex>x_2</tex>. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов: |
{|align="center" | {|align="center" | ||
Строка 86: | Строка 87: | ||
{|align="center" | {|align="center" | ||
- | ! Чувствительность !! Ложная тревога !! Чувствительность !! Ложная тревога | + | ! Чувствительность !! Ложная тревога !! !! Чувствительность !! Ложная тревога |
|- | |- | ||
| 0.58 || 0.11 || || 0.53 || 0.04 | | 0.58 || 0.11 || || 0.53 || 0.04 | ||
Строка 96: | Строка 97: | ||
|} | |} | ||
- | 5. Задана таблица совместных значений прогнозируемой переменной | + | 5. Задана таблица совместных значений прогнозируемой переменной <tex>Y</tex> и объясняющей переменной <tex>X</tex>. Требуется вычислить ковариацию между <tex>Y</tex> и <tex>X</tex>, коэффициент корреляции между <tex>Y</tex> и <tex>X</tex>, коэффициенты одномерной линейной регрессии. |
- | + | ||
- | + | <tex>\begin{tabular}{c|ccccc} Y & 0.8 & 1.9 & 7.2 & 8.5 & 9.6 \\ X & -1.9 & 4.3 & 5.4 & 6.9 & 8.3 \end{tabular} </tex> | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
6. Заданы таблицы значений бинарных признаков для классов <tex>K_1</tex> и <tex>K_2</tex>. Требуется найти '''все''' тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом. | 6. Заданы таблицы значений бинарных признаков для классов <tex>K_1</tex> и <tex>K_2</tex>. Требуется найти '''все''' тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом. |
Версия 14:27, 9 января 2013
Вариант 1
1. Рассматривается задача классификации объектов на два класса по одному неотрицательному признаку. Предполагается, что значение признака для объектов из классов распределено по закону Рэлея:
- Пусть . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.1 и 0.9.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
- Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
2.7 | 3.4 | 4.1 | -4.5 | -3.3 | -3.3 | |||
4.2 | 3.1 | 2.9 | -1.2 | -1.5 | -0.6 |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 1000, наблюдателей~--- 100 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков.
Чувствительность | Ложная тревога |
---|---|
0.52 | 0.11 |
0.70 | 0.19 |
0.99 | 0.32 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | |
0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | |
1 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | |
1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 |
Вариант 2
1. Рассматривается задача классификации объектов на два класса по одному признаку. Предполагается, что значение признака для объектов из двух классов распределено по лапласовскому закону
с параметрами . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.8 и 0.2.
2. Имеется задача распознавания с 4-мя классами и одним признаком. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | ||||||||
---|---|---|---|---|---|---|---|---|---|
2.7 | 2.5 | 1.1 | -3.2 | -3.7 | -4.2 | -4.1 | |||
1.5 | 1.2 | 2.7 | -4.9 | -1.2 | -3.6 | -5.1 |
4. Банком тестируется два метода идентификации недобросовестных заёмщиков. Известно, что средний доход от одного добросовестного заёмщика составляет 3 единицы, средняя величина потерь от одного недобросовестного заёмщика - 9 единиц. Известно, что доля недобросовестных заёмщиков 30%. Известно несколько точек графика ROC–кривой для двух распознающих операторов. Требуется установить на основании этой информации целесообразность использования банком одной из технологий распознавания, оценить максимальный дополнительный доход на одного заёмщика.
Чувствительность | Ложная тревога | Чувствительность | Ложная тревога | |
---|---|---|---|---|
0.58 | 0.11 | 0.53 | 0.04 | |
0.67 | 0.19 | 0.90 | 0.27 | |
0.93 | 0.19 | 0.92 | 0.33 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | |
0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | |
0 | 0 | 1 | 1 | 1 | 0 | 1 | 0 | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 |
Вариант 3
1. Рассматривается задача классификации объектов на два класса по одному \textit{дискретному} признаку. Предполагается, что значение признака $x$ для объектов из первого класса имеет равномерное дискретное распределение на интервале $[a,b]$, а для второго класса~--- по геометрическому закону: $$ \mathbb{P}(x=k|q) = q^k(1-q),\ k=0,1,2,\dots $$ Пусть $a=0,b=4,q=0.9$. Требуется найти области значений признака $x$, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции: \begin{align*} &f_1(x_1,x_2) = -5+x_1+3x_2,\\ &f_2(x_1,x_2) = -2+4x_1+5x_2,\\ &f_3(x_1,x_2) = 5+4x_1+2x_2. \end{align*} Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков $x_1$ и $x_2$. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов: \begin{center} \begin{tabular}{ccc} Класс 1 & & Класс 2 \\ \begin{tabular}{c|cccc} $x_1$ & 1.9 & 0.8 & 1.3 & 1.6 \\ $x_2$ & 3.3 & -0.1 & 1.8 & 1.8 \end{tabular} & \qquad\qquad & \begin{tabular}{c|ccc} $x_1$ & -1.9 & -1.6 & -0.4 \\ $x_2$ & -3.0 & -3.4 & -1.1 \end{tabular} \end{tabular} \end{center}
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей~--- 600 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков. \begin{center} \begin{tabular}{cc} Чувствительность & Ложная тревога \\ \hline 0.54 & 0.01 \\ 0.68 & 0.33 \\ 0.71 & 0.35 \\ \end{tabular} \end{center}
5. Задана таблица совместных значений прогнозируемой переменной $Y$ и объясняющей переменной $X$. Требуется вычислить ковариацию между $Y$ и $X$, коэффициент корреляции между $Y$ и $X$, коэффициенты одномерной линейной регрессии. \begin{center} \begin{tabular}{c|ccccc} $Y$ & 9.2 & 8.6 & 8.1 & 5.9 & 4.7 \\ $X$ & 7.9 & 5.9 & 3.2 & 1.6 & -0.1 \end{tabular} \end{center}
6. Заданы таблицы значений бинарных признаков для классов $K_1$ и $K_2$. Требуется найти \textbf{все} тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | |
1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |