Динамическая классификация при распознавании рукописного и поврежденного текста.

Материал из MachineLearning.

Машинное обучение и распознавание восточных рукописных текстов Для распознавания древних манускриптов создается программа оптического распознавания и машинного перевода восточных текстов. В качестве графической свертки признаков мы использовали фокальные точки и фокальные линии изображения, описанные кривыми Безье.

На конечном этапе сравнение ведется по признакам на основе трехслойного неокогнитрона. Этот метод свертки более медленный, но обладает очень высокой различающей способностью и устойчивостью к шуму в пределах до 1/5 от линейного размера признака. Реализация неокогнитрона на базе регистровых команд позволила добиться скорости распознавания. Такой подход хорошо себя показал при распознавании печатных текстов. Задача. На следующем этапе для уверенного распознавания рукописного и ксилографического текста необходимо решить задачу машинного обучения. Каждый текст отличается от предыдущего, часто даже страницы в рукописи не похожи одна на другую. Одним из методов, позволяющим обучить нейросеть и выявлять закономерности в графическом узоре является генетический алгоритм. Этот алгоритм позволяет создать множество вариаций сети для решения задачи и выбрать наилучший. Постепенно в результате скрещивания и отбора вариантов построения нейросети выявляется оптимальная конфигурация. Метод позволяет например обучить сеть играть в компьютерные игры. Пример реализации этого алгоритма для игры Марио: Мы воспроизвели код целиком на с++ и будем рады поделится.

Для распознавания рукописного текста необходимо решить задачу выявления паттернов и их сочетаний в графическом узоре. Нужно научить программу разделять задачу на этапы, выявлять закономерности, создавать на их основе гипотезы и подтверждать или опровергать эти гипотезы на основе опыта.

В первом приближении задачу можно рассмотреть как выбор метода графических сверток и задачу оптимизации Беллмана решаемую методом сверточной нейросети.

Однако сложность в том, что в отличие от печатного текста не удается определить вероятность сочетания признаков на основе только размеченной обучающей выборки. Необходимо понять, как применить машинное обучение для поиска и классификации закономерностей распределения признаков на основе самого текста.

Решение этой задачи имеет применение и в других задачах машинного обучения. Например при выявлении графических образов, колоризации изображения и машинном переводе.

Одним из вариантов обучения является программное создание онтологии. Этот подход применяется при машинном переводе и создании чат-ботов.

В этом случае взаимосвязь образов и понятий записывается в виде небольшой подпрограммы на скриптовом языке и выполняется в момент распознавания. Подход аналогичен записи весовых коэффициентов в нейронной сети.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%94%D0%B8%D0%BD%D0%B0%D0%BC%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F_%D0%BF%D1%80%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B8_%D1%80%D1%83%D0%BA%D0%BE%D0%BF%D0%B8%D1%81%D0%BD%D0%BE%D0%B3%D0%BE_%D0%B8_%D0%BF%D0%BE%D0%B2%D1%80%D0%B5%D0%B6%D0%B4%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0.»

Категория: Открытые проблемы и полемика

Динамическая классификация при распознавании рукописного и поврежденного текста.

Материал из MachineLearning.

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты