Динамическая классификация при распознавании рукописного и поврежденного текста.
Материал из MachineLearning.
Машинное обучение и распознавание восточных рукописных текстов Для распознавания древних манускриптов создается программа оптического распознавания и машинного перевода восточных текстов. В качестве графической свертки признаков мы использовали фокальные точки и фокальные линии изображения, описанные кривыми Безье.
На конечном этапе сравнение ведется по признакам на основе трехслойного неокогнитрона. Этот метод свертки более медленный, но обладает очень высокой различающей способностью и устойчивостью к шуму в пределах до 1/5 от линейного размера признака. Реализация неокогнитрона на базе регистровых команд позволила добиться скорости распознавания. Такой подход хорошо себя показал при распознавании печатных текстов. Задача. На следующем этапе для уверенного распознавания рукописного и ксилографического текста необходимо решить задачу машинного обучения. Каждый текст отличается от предыдущего, часто даже страницы в рукописи не похожи одна на другую. Одним из методов, позволяющим обучить нейросеть и выявлять закономерности в графическом узоре является генетический алгоритм. Этот алгоритм позволяет создать множество вариаций сети для решения задачи и выбрать наилучший. Постепенно в результате скрещивания и отбора вариантов построения нейросети выявляется оптимальная конфигурация. Метод позволяет например обучить сеть играть в компьютерные игры. Пример реализации этого алгоритма для игры Марио: Мы воспроизвели код целиком на с++ и будем рады поделится.
Для распознавания рукописного текста необходимо решить задачу выявления паттернов и их сочетаний в графическом узоре. Нужно научить программу разделять задачу на этапы, выявлять закономерности, создавать на их основе гипотезы и подтверждать или опровергать эти гипотезы на основе опыта.
В первом приближении задачу можно рассмотреть как выбор метода графических сверток и задачу оптимизации Беллмана решаемую методом сверточной нейросети.
Однако сложность в том, что в отличие от печатного текста не удается определить вероятность сочетания признаков на основе только размеченной обучающей выборки. Необходимо понять, как применить машинное обучение для поиска и классификации закономерностей распределения признаков на основе самого текста.
Решение этой задачи имеет применение и в других задачах машинного обучения. Например при выявлении графических образов, колоризации изображения и машинном переводе.
Одним из вариантов обучения является программное создание онтологии. Этот подход применяется при машинном переводе и создании чат-ботов.
В этом случае взаимосвязь образов и понятий записывается в виде небольшой подпрограммы на скриптовом языке и выполняется в момент распознавания. Подход аналогичен записи весовых коэффициентов в нейронной сети.