Полигон алгоритмов/Формат результатов тестирования алгоритма на задаче

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Описание файла)
Строка 6: Строка 6:
В каждой строке записаны числа в следующем порядке:
В каждой строке записаны числа в следующем порядке:
-
# Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму
+
# Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму.
-
# Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками)
+
# Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками).
-
# Номер теста в текущем задании
+
# Номер теста в текущем задании.
-
# Номер объекта в общей выборке
+
# Номер объекта в общей выборке.
-
# Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль.
+
# Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль.
-
# Правильный объект на данном объекте
+
# Правильный класс на данном объекте.
-
# Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом
+
# Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом.
-
# Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом
+
# Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом.
==Использование результатов тестирования при расчете статистик==
==Использование результатов тестирования при расчете статистик==

Версия 17:42, 10 августа 2010

Результаты тестирования экземпляра алгоритма на конкретной задаче можно получить по ссылке Скачать результаты тестирования на странице соответствующего подробного отчета. Будет получен .csv-файл

Описание файла

Для разделения чисел между собой используется ‘;’, а для отделения дробной части – ‘,’.

В каждой строке записаны числа в следующем порядке:

  1. Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму.
  2. Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками).
  3. Номер теста в текущем задании.
  4. Номер объекта в общей выборке.
  5. Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль.
  6. Правильный класс на данном объекте.
  7. Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом.
  8. Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом.

Использование результатов тестирования при расчете статистик

Расчеты статистик в Системе в основном ведутся по разбиениям скользящего контроля (с кодом CV_q), кроме статистик «кривая обучения» и «кривая переобученности», которые рассчитываются на разбиениях с типом L_t.

Личные инструменты