Полигон алгоритмов/Формат результатов тестирования алгоритма на задаче
Материал из MachineLearning.
Результаты тестирования экземпляра алгоритма на конкретной задаче можно получить по ссылке Скачать результаты тестирования на странице соответствующего подробного отчета. Будет получен .csv-файл
Описание файла
Для разделения чисел между собой используется ‘;’, а для отделения дробной части – ‘,’.
В каждой строке записаны числа в следующем порядке:
- Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму
- Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками)
- Номер теста в текущем задании
- Номер объекта в общей выборке
- Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль.
- Правильный объект на данном объекте
- Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом
- Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом
Использование результатов тестирования при расчете статистик
Расчеты статистик в Системе в основном ведутся по разбиениям скользящего контроля (с кодом CV_q), кроме статистик «кривая обучения» и «кривая переобученности», которые рассчитываются на разбиениях с типом L_t.