Участник:LuarSoll/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
-
'''Отступ''' (margin) объекта из [[Обучающая выборка|обучающей выборки]] - величина, показывающая степень типичности этого объекта
+
'''Отступ''' (margin) объекта из [[Обучающая выборка|обучающей выборки]] - величина, показывающая степень типичности этого объекта, "расстояние" от этого объекта до границы класса
==Основная формула==
==Основная формула==
Строка 19: Строка 19:
*Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным
*Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным
*Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива
*Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива
 +
 +
==Литература==
 +
{{книга
 +
|автор = Воронцов К.В.
 +
|заглавие = Лекции по метрическим алгоритмам классификации
 +
|ссылка = http://www.machinelearning.ru/wiki/images/9/9d/Voron-ML-Metric.pdf
 +
}}

Версия 16:19, 26 декабря 2009

Отступ (margin) объекта из обучающей выборки - величина, показывающая степень типичности этого объекта, "расстояние" от этого объекта до границы класса

Содержание

Основная формула

Отступ объекта x_i \in X^l относительно алгоритма классификации, имеющего вид a(u)=\mathrm{arg}\max_{y\in Y}\Gamma_{y}(u) - определяется формулой M(x_i)=\Gamma_y_i(x_i)-\max_{y \in Y \setminus y_i}\Gamma_y(x_i)

Степени типичности объектов

  • Эталонные объекты - объекты, имеющие большой положительный отступ, плотно окруженные объектами своего класса и являющиеся наиболее типичными его представителями.
  • Неинформативные объекты - объекты, имеющие положительный отступ. Изъятие их из выборки не влияет на качество классификации.
  • Пограничные объекты - объекты с отступом, близким к нулю. Классификация пограничных ответов неустойчива, малые изменения метрики, параметров алгоритма классификации или обучающей выборки могут изменить их классификацию.
  • Ошибочные объекты - объекты с отрицательным отступом. На них данный алгоритм классификации дает ошибку
  • Шумовые объекты (выбросы) - объекты с большим по модулю отрицательным отступом. Они плотно окружены объектами другого класса и возникают из-за ошибок или недостатка информации в исходных данных.

Применение отступов

Для отбора эталонных объектов

Для оценки качества выборки

  • Если большая часть объектов обучающей выборки имеет положительные отступы, выборку можно считать разделимой
  • Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным
  • Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива

Литература

Воронцов К.В. Лекции по метрическим алгоритмам классификации.

Личные инструменты