Обсуждение:Прогнозирование формы множества

Материал из MachineLearning.

Версия от 13:42, 11 июля 2010; Vokov (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Первое впечатление

Yet Another Classifier. Во всём мире специалисты по Machine Learning давно сошлись во мнении, что изобретение очередных «универсальных» (и по любому эвристических!) методов классификации лишено смысла. Уже есть тысячи методов, и простым комбинированием известных идей можно изобрести ещё миллионы. Один из них и предложен в данной статье.

Есть ещё одно популярное мнение. Практически любую изначально разумную эвристику можно довести до «мирового уровня», если тщательно её поисследовать, выявить причины недостатков и устранить их с помощью десятка «вспомогательных эвристик», попросту говоря, «костылей» и «заплаток». Такая доводка требует большого труда и времени. Вопрос: имеют ли смысл трудозатраты на изобретение велосипеда, если можно взять любой готовый «универсальный» метод, скажем, нейронную сеть, машину опорных векторов, бустинг над решающими деревьями, и т.д.

Такая работа обычно имеет смысл, если в основе метода лежит удачная, простая и красивая математика. Например, в бустинге и в SVM она есть, и это определило «удачность» и популярность этих методов. Наличие изящной математической идеи позволяет достаточно далеко продвинуться в теоретическом понимании метода. Если же метод слишком громоздкий или основан на эклектичном наборе эвристик (IMHO что и имеет место быть в данной статье), то его теоретическое исследование будет сильно затруднено, совершенствовать его придётся чисто эмпирически, путём проб и ошибок. У автора может просто не хватить времени, сил, энтузиазма на доведение своей задумки до конкурентоспособного уровня.

Несколько мелких замечаний:

  • необходимо расставить запятые согласно правилам русской пунктуации;
  • стиль оставляет желать лучшего («классическую задачу классификации», «формы множеств», «прогнозирования множества всех возможных объектов с ассоциированными классами», и многое другое);
  • «Если признаки бинарные то можно выбрать в качестве мета-признака элементарную дизъюнкцию» — может, всё-таки, конъюнкцию, раз выше речь шла о пересечении?
  • без строгой математической постановки задачи довольно трудно понять, что же всё-таки предлагается;
  • построение алгоритмов классификации на основе ДНФ и КНФ было предложено многими авторами лет 40–50 назад, в частности, академиком Ю. И. Журавлёвым; в чём отличие предлагаемого метода?
  • зачем использовать триангуляцию Делоне? наверняка можно сделать попроще, и работать будет не хуже;
  • предлагаемый метод вызывает кучу ассоциаций и с байесовским классификатором, и с методом потенциальных функций, и с композициями типа бустинга, и с дискретно-логическими алгоритмами; не понятно, почему он должен быть лучше других;
  • не думаю, что автору удастся решить проблему стремительной потери эффективности при увеличении размерности.

— К.В.Воронцов 17:42, 11 июля 2010 (MSD)

Личные инструменты