Участник:Kropotov/Песочница
Материал из MachineLearning.
| Строка 120: | Строка 120: | ||
'''Вариант 3''' | '''Вариант 3''' | ||
| - | 1. Рассматривается задача классификации объектов на два класса по одному | + | 1. Рассматривается задача классификации объектов на два класса по одному ''дискретному'' признаку. Предполагается, что значение признака <tex>x</tex> для объектов из первого класса имеет равномерное дискретное распределение на интервале <tex>[a,b]</tex>, а для второго класса - по геометрическому закону: |
| - | + | ||
| - | Пусть | + | <tex> \mathbb{P}(x=k|q) = q^k(1-q),\ k=0,1,2,\dots </tex> |
| + | |||
| + | Пусть <tex>a=0,b=4,q=0.9</tex>. Требуется найти области значений признака <tex>x</tex>, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3. | ||
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции: | 2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции: | ||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | 3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков | + | <tex> \begin{align*} &f_1(x_1,x_2) = -5+x_1+3x_2,\\ &f_2(x_1,x_2) = -2+4x_1+5x_2,\\ &f_3(x_1,x_2) = 5+4x_1+2x_2. \end{align*}</tex> |
| - | + | ||
| - | + | Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3. | |
| - | + | ||
| - | + | 3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков <tex>x_1</tex> и <tex>x_2</tex>. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов: | |
| - | + | ||
| - | + | {|align="center" | |
| - | + | ! colspan="5"|Класс 1 !! !! colspan="4"|Класс 2 | |
| - | + | |- | |
| - | + | | <tex>x_1</tex> || 1.9 || 0.8 || 1.3 || 1.6 || || <tex>x_1</tex> || -1.9 || -1.6 || -0.4 | |
| - | + | |- | |
| - | + | | <tex>x_2</tex> || 3.3 || -0.1 || 1.8 || 1.8 || || <tex>x_2</tex> || -3.0 || -3.4 || -1.1 | |
| - | + | |- | |
| - | + | |} | |
| + | |||
| + | 4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей - 600 и доля <<грязных>> участков - 20%. При этом под оптимальностью понимается максимизация количества честных участков. | ||
| + | |||
| + | {|border="0" | ||
| + | !Чувствительность !! Ложная тревога | ||
| + | |- | ||
| + | | align="center"|0.54 || align="center"|0.01 | ||
| + | |- | ||
| + | | align="center"|0.68 || align="center"|0.33 | ||
| + | |- | ||
| + | | align="center"|0.71 || align="center"|0.35 | ||
| + | |- | ||
| + | |} | ||
| - | + | 5. Задана таблица совместных значений прогнозируемой переменной <tex>Y</tex> и объясняющей переменной <tex>X</tex>. Требуется вычислить ковариацию между <tex>Y</tex> и <tex>X</tex>, коэффициент корреляции между <tex>Y</tex> и <tex>X</tex>, коэффициенты одномерной линейной регрессии. | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | <tex> \begin{tabular}{c|ccccc} Y & 9.2 & 8.6 & 8.1 & 5.9 & 4.7 \\ X & 7.9 & 5.9 & 3.2 & 1.6 & -0.1 \end{tabular} </tex> | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | 6. Заданы таблицы значений бинарных признаков для классов | + | 6. Заданы таблицы значений бинарных признаков для классов <tex>K_1</tex> и <tex>K_2</tex>. Требуется найти '''все''' тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом. |
{|align="center" | {|align="center" | ||
Версия 14:35, 9 января 2013
Вариант 1
1. Рассматривается задача классификации объектов на два класса по одному неотрицательному признаку. Предполагается, что значение признака для объектов из классов
распределено по закону Рэлея:
- Пусть
. Требуется найти области значений признака
, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.1 и 0.9.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
- Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и
. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
| Класс 1 | Класс 2 | |||||||
|---|---|---|---|---|---|---|---|---|
| | 2.7 | 3.4 | 4.1 | | -4.5 | -3.3 | -3.3 | |
| | 4.2 | 3.1 | 2.9 | | -1.2 | -1.5 | -0.6 | |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 1000, наблюдателей~--- 100 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков.
| Чувствительность | Ложная тревога |
|---|---|
| 0.52 | 0.11 |
| 0.70 | 0.19 |
| 0.99 | 0.32 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной
. Требуется вычислить ковариацию между
и
, коэффициент корреляции между
и
, коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и
. Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
| Класс 1 | Класс 2 | |||||||
|---|---|---|---|---|---|---|---|---|
| X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
| 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | |
| 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | |
| 1 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | |
| 1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | |
Вариант 2
1. Рассматривается задача классификации объектов на два класса по одному признаку. Предполагается, что значение признака для объектов из двух классов
распределено по лапласовскому закону
с параметрами . Требуется найти области значений признака
, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.8 и 0.2.
2. Имеется задача распознавания с 4-мя классами и одним признаком. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и
. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
| Класс 1 | Класс 2 | ||||||||
|---|---|---|---|---|---|---|---|---|---|
| | 2.7 | 2.5 | 1.1 | | -3.2 | -3.7 | -4.2 | -4.1 | |
| | 1.5 | 1.2 | 2.7 | | -4.9 | -1.2 | -3.6 | -5.1 | |
4. Банком тестируется два метода идентификации недобросовестных заёмщиков. Известно, что средний доход от одного добросовестного заёмщика составляет 3 единицы, средняя величина потерь от одного недобросовестного заёмщика - 9 единиц. Известно, что доля недобросовестных заёмщиков 30%. Известно несколько точек графика ROC–кривой для двух распознающих операторов. Требуется установить на основании этой информации целесообразность использования банком одной из технологий распознавания, оценить максимальный дополнительный доход на одного заёмщика.
| Чувствительность | Ложная тревога | Чувствительность | Ложная тревога | |
|---|---|---|---|---|
| 0.58 | 0.11 | 0.53 | 0.04 | |
| 0.67 | 0.19 | 0.90 | 0.27 | |
| 0.93 | 0.19 | 0.92 | 0.33 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной
. Требуется вычислить ковариацию между
и
, коэффициент корреляции между
и
, коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и
. Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
| Класс 1 | Класс 2 | |||||||
|---|---|---|---|---|---|---|---|---|
| X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
| 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | |
| 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | |
| 0 | 0 | 1 | 1 | 1 | 0 | 1 | 0 | |
| 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | |
Вариант 3
1. Рассматривается задача классификации объектов на два класса по одному дискретному признаку. Предполагается, что значение признака для объектов из первого класса имеет равномерное дискретное распределение на интервале
, а для второго класса - по геометрическому закону:
Пусть . Требуется найти области значений признака
, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и
. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
| Класс 1 | Класс 2 | ||||||||
|---|---|---|---|---|---|---|---|---|---|
| | 1.9 | 0.8 | 1.3 | 1.6 | | -1.9 | -1.6 | -0.4 | |
| | 3.3 | -0.1 | 1.8 | 1.8 | | -3.0 | -3.4 | -1.1 | |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей - 600 и доля <<грязных>> участков - 20%. При этом под оптимальностью понимается максимизация количества честных участков.
| Чувствительность | Ложная тревога |
|---|---|
| 0.54 | 0.01 |
| 0.68 | 0.33 |
| 0.71 | 0.35 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной
. Требуется вычислить ковариацию между
и
, коэффициент корреляции между
и
, коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и
. Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
| Класс 1 | Класс 2 | |||||||
|---|---|---|---|---|---|---|---|---|
| X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
| 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | |
| 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
| 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
| 0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | |

