MNIST database of handwritten digits
Материал из MachineLearning.
Sirotenko (Обсуждение | вклад)
(Новая: === Содержание базы === База MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестировани...)
К следующему изменению →
Версия 00:09, 16 марта 2009
Содержание |
Содержание базы
База MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестирования. MNIST является укороченной версией базы NIST. Кроме того изображения в базе нормированы по размеру и отцентрованы внутри изображения.
База отлично подходит для тех, кому необходимо опробовать методы обучения на реальных данных без дополнительных затрат усилий на форматирование и предобработку.
Формат изображений
База состоит из 4 файлов: непосредственно изображений и меток, содержащих цифры соответствующие изображениям для обучающей и для тестовой выборки. В базе содержатся изображения рукописных цифр в градациях серого, размером 20х20 пикселей вписанные в квадрат 28х28, центрование с помощью поиска центра масс. База записана в формате IDX. Все данные записаны в формате high endian, что не типично для не-intel процессоров.
Условия распространения
База распространяется свободно.
Ссылки
- База MNIST на домашней странице Yann LeCun
- М-файл для Matlab, реализующий загрузку базы MNIST М-файл, ZIP