Участник:Kropotov/Песочница
Материал из MachineLearning.
Строка 120: | Строка 120: | ||
'''Вариант 3''' | '''Вариант 3''' | ||
- | 1. Рассматривается задача классификации объектов на два класса по одному | + | 1. Рассматривается задача классификации объектов на два класса по одному ''дискретному'' признаку. Предполагается, что значение признака <tex>x</tex> для объектов из первого класса имеет равномерное дискретное распределение на интервале <tex>[a,b]</tex>, а для второго класса - по геометрическому закону: |
- | + | ||
- | Пусть | + | <tex> \mathbb{P}(x=k|q) = q^k(1-q),\ k=0,1,2,\dots </tex> |
+ | |||
+ | Пусть <tex>a=0,b=4,q=0.9</tex>. Требуется найти области значений признака <tex>x</tex>, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3. | ||
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции: | 2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции: | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | 3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков | + | <tex> \begin{align*} &f_1(x_1,x_2) = -5+x_1+3x_2,\\ &f_2(x_1,x_2) = -2+4x_1+5x_2,\\ &f_3(x_1,x_2) = 5+4x_1+2x_2. \end{align*}</tex> |
- | + | ||
- | + | Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3. | |
- | + | ||
- | + | 3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков <tex>x_1</tex> и <tex>x_2</tex>. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов: | |
- | + | ||
- | + | {|align="center" | |
- | + | ! colspan="5"|Класс 1 !! !! colspan="4"|Класс 2 | |
- | + | |- | |
- | + | | <tex>x_1</tex> || 1.9 || 0.8 || 1.3 || 1.6 || || <tex>x_1</tex> || -1.9 || -1.6 || -0.4 | |
- | + | |- | |
- | + | | <tex>x_2</tex> || 3.3 || -0.1 || 1.8 || 1.8 || || <tex>x_2</tex> || -3.0 || -3.4 || -1.1 | |
- | + | |- | |
- | + | |} | |
+ | |||
+ | 4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей - 600 и доля <<грязных>> участков - 20%. При этом под оптимальностью понимается максимизация количества честных участков. | ||
+ | |||
+ | {|border="0" | ||
+ | !Чувствительность !! Ложная тревога | ||
+ | |- | ||
+ | | align="center"|0.54 || align="center"|0.01 | ||
+ | |- | ||
+ | | align="center"|0.68 || align="center"|0.33 | ||
+ | |- | ||
+ | | align="center"|0.71 || align="center"|0.35 | ||
+ | |- | ||
+ | |} | ||
- | + | 5. Задана таблица совместных значений прогнозируемой переменной <tex>Y</tex> и объясняющей переменной <tex>X</tex>. Требуется вычислить ковариацию между <tex>Y</tex> и <tex>X</tex>, коэффициент корреляции между <tex>Y</tex> и <tex>X</tex>, коэффициенты одномерной линейной регрессии. | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | <tex> \begin{tabular}{c|ccccc} Y & 9.2 & 8.6 & 8.1 & 5.9 & 4.7 \\ X & 7.9 & 5.9 & 3.2 & 1.6 & -0.1 \end{tabular} </tex> | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | 6. Заданы таблицы значений бинарных признаков для классов | + | 6. Заданы таблицы значений бинарных признаков для классов <tex>K_1</tex> и <tex>K_2</tex>. Требуется найти '''все''' тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом. |
{|align="center" | {|align="center" |
Версия 14:35, 9 января 2013
Вариант 1
1. Рассматривается задача классификации объектов на два класса по одному неотрицательному признаку. Предполагается, что значение признака для объектов из классов распределено по закону Рэлея:
- Пусть . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.1 и 0.9.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
- Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
2.7 | 3.4 | 4.1 | -4.5 | -3.3 | -3.3 | |||
4.2 | 3.1 | 2.9 | -1.2 | -1.5 | -0.6 |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 1000, наблюдателей~--- 100 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков.
Чувствительность | Ложная тревога |
---|---|
0.52 | 0.11 |
0.70 | 0.19 |
0.99 | 0.32 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | |
0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | |
1 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | |
1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 |
Вариант 2
1. Рассматривается задача классификации объектов на два класса по одному признаку. Предполагается, что значение признака для объектов из двух классов распределено по лапласовскому закону
с параметрами . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.8 и 0.2.
2. Имеется задача распознавания с 4-мя классами и одним признаком. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | ||||||||
---|---|---|---|---|---|---|---|---|---|
2.7 | 2.5 | 1.1 | -3.2 | -3.7 | -4.2 | -4.1 | |||
1.5 | 1.2 | 2.7 | -4.9 | -1.2 | -3.6 | -5.1 |
4. Банком тестируется два метода идентификации недобросовестных заёмщиков. Известно, что средний доход от одного добросовестного заёмщика составляет 3 единицы, средняя величина потерь от одного недобросовестного заёмщика - 9 единиц. Известно, что доля недобросовестных заёмщиков 30%. Известно несколько точек графика ROC–кривой для двух распознающих операторов. Требуется установить на основании этой информации целесообразность использования банком одной из технологий распознавания, оценить максимальный дополнительный доход на одного заёмщика.
Чувствительность | Ложная тревога | Чувствительность | Ложная тревога | |
---|---|---|---|---|
0.58 | 0.11 | 0.53 | 0.04 | |
0.67 | 0.19 | 0.90 | 0.27 | |
0.93 | 0.19 | 0.92 | 0.33 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | |
0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | |
0 | 0 | 1 | 1 | 1 | 0 | 1 | 0 | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 |
Вариант 3
1. Рассматривается задача классификации объектов на два класса по одному дискретному признаку. Предполагается, что значение признака для объектов из первого класса имеет равномерное дискретное распределение на интервале , а для второго класса - по геометрическому закону:
Пусть . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1.9 | 0.8 | 1.3 | 1.6 | -1.9 | -1.6 | -0.4 | |||
3.3 | -0.1 | 1.8 | 1.8 | -3.0 | -3.4 | -1.1 |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей - 600 и доля <<грязных>> участков - 20%. При этом под оптимальностью понимается максимизация количества честных участков.
Чувствительность | Ложная тревога |
---|---|
0.54 | 0.01 |
0.68 | 0.33 |
0.71 | 0.35 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | |
1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |