MNIST database of handwritten digits

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Содержание базы

База MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестирования. MNIST является укороченной версией базы NIST. Кроме того изображения в базе нормированы по размеру и отцентрованы внутри изображения.

База отлично подходит для тех, кому необходимо опробовать методы обучения на реальных данных без дополнительных затрат усилий на форматирование и предобработку.

Формат изображений

База состоит из 4 файлов: непосредственно изображений и меток, содержащих цифры соответствующие изображениям для обучающей и для тестовой выборки. В базе содержатся изображения рукописных цифр в градациях серого, размером 20х20 пикселей вписанные в квадрат 28х28, центрование с помощью поиска центра масс. База записана в формате IDX. Все данные записаны в формате high endian, что не типично для не-intel процессоров.

Условия распространения

База распространяется свободно.

Ссылки

Личные инструменты