Участник:Kropotov/Песочница
Материал из MachineLearning.
Вариант 1
1. Рассматривается задача классификации объектов на два класса по одному неотрицательному признаку. Предполагается, что значение признака для объектов из классов распределено по закону Рэлея:
- Пусть . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.1 и 0.9.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
- Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
2.7 | 3.4 | 4.1 | -4.5 | -3.3 | -3.3 | |||
4.2 | 3.1 | 2.9 | -1.2 | -1.5 | -0.6 |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 1000, наблюдателей~--- 100 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков.
Чувствительность | Ложная тревога |
---|---|
0.52 | 0.11 |
0.70 | 0.19 |
0.99 | 0.32 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | |
0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | |
1 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | |
1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 |
Вариант 2
1. Рассматривается задача классификации объектов на два класса по одному признаку. Предполагается, что значение признака для объектов из двух классов распределено по лапласовскому закону
с параметрами . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.8 и 0.2.
2. Имеется задача распознавания с 4-мя классами и одним признаком. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | ||||||||
---|---|---|---|---|---|---|---|---|---|
2.7 | 2.5 | 1.1 | -3.2 | -3.7 | -4.2 | -4.1 | |||
1.5 | 1.2 | 2.7 | -4.9 | -1.2 | -3.6 | -5.1 |
4. Банком тестируется два метода идентификации недобросовестных заёмщиков. Известно, что средний доход от одного добросовестного заёмщика составляет 3 единицы, средняя величина потерь от одного недобросовестного заёмщика - 9 единиц. Известно, что доля недобросовестных заёмщиков 30%. Известно несколько точек графика ROC–кривой для двух распознающих операторов. Требуется установить на основании этой информации целесообразность использования банком одной из технологий распознавания, оценить максимальный дополнительный доход на одного заёмщика.
Чувствительность | Ложная тревога | Чувствительность | Ложная тревога | |
---|---|---|---|---|
0.58 | 0.11 | 0.53 | 0.04 | |
0.67 | 0.19 | 0.90 | 0.27 | |
0.93 | 0.19 | 0.92 | 0.33 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | |
0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | |
0 | 0 | 1 | 1 | 1 | 0 | 1 | 0 | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 |
Вариант 3
1. Рассматривается задача классификации объектов на два класса по одному дискретному признаку. Предполагается, что значение признака для объектов из первого класса имеет равномерное дискретное распределение на интервале , а для второго класса - по геометрическому закону:
Пусть . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1.9 | 0.8 | 1.3 | 1.6 | -1.9 | -1.6 | -0.4 | |||
3.3 | -0.1 | 1.8 | 1.8 | -3.0 | -3.4 | -1.1 |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей - 600 и доля <<грязных>> участков - 20%. При этом под оптимальностью понимается максимизация количества честных участков.
Чувствительность | Ложная тревога |
---|---|
0.54 | 0.01 |
0.68 | 0.33 |
0.71 | 0.35 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | |
1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |