Полигон алгоритмов/Формат результатов тестирования алгоритма на задаче
Материал из MachineLearning.
(Различия между версиями)
м (→Описание файла) |
|||
Строка 6: | Строка 6: | ||
В каждой строке записаны числа в следующем порядке: | В каждой строке записаны числа в следующем порядке: | ||
- | # Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму | + | # Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму. |
- | # Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками) | + | # Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками). |
- | # Номер теста в текущем задании | + | # Номер теста в текущем задании. |
- | # Номер объекта в общей выборке | + | # Номер объекта в общей выборке. |
- | # Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль. | + | # Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль. |
- | # Правильный | + | # Правильный класс на данном объекте. |
- | # Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом | + | # Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом. |
- | # Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом | + | # Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом. |
==Использование результатов тестирования при расчете статистик== | ==Использование результатов тестирования при расчете статистик== |
Версия 17:42, 10 августа 2010
Результаты тестирования экземпляра алгоритма на конкретной задаче можно получить по ссылке Скачать результаты тестирования на странице соответствующего подробного отчета. Будет получен .csv-файл
Описание файла
Для разделения чисел между собой используется ‘;’, а для отделения дробной части – ‘,’.
В каждой строке записаны числа в следующем порядке:
- Номер набора разбиений (сплитсета) – один набор разбиений соответствует одной прогонке скользящего контроля или одной прогонке тестов с последовательным увеличением числа обучающих объектов, также соответствует одному заданию, выданному алгоритму.
- Тип набора разбиений – например, CV_5 (скользящий контроль с 5-ю блоками) или L_10 (увеличение длины обучающей выборки с 10-ю блоками).
- Номер теста в текущем задании.
- Номер объекта в общей выборке.
- Режим, в котором находился объект в данном тесте: “learn” – если обучение и “test” – если контроль.
- Правильный класс на данном объекте.
- Ответ алгоритма на этом объекте – из вектора Answers, возвращенного алгоритмом.
- Далее по очереди выводятся вероятности отнесения этого объекта к какому-либо классу для этого теста – из матрицы ProbabilityMatrix, возвращенной алгоритмом.
Использование результатов тестирования при расчете статистик
Расчеты статистик в Системе в основном ведутся по разбиениям скользящего контроля (с кодом CV_q), кроме статистик «кривая обучения» и «кривая переобученности», которые рассчитываются на разбиениях с типом L_t.