Участник:Ryskina
Материал из MachineLearning.
(Различия между версиями)
Строка 1: | Строка 1: | ||
Рыскина М.Н. | Рыскина М.Н. | ||
- | + | МФТИ, ФУПМ, 074 | |
Кафедра '''"Интеллектуальные системы"''' | Кафедра '''"Интеллектуальные системы"''' |
Версия 17:51, 29 августа 2013
Рыскина М.Н.
МФТИ, ФУПМ, 074
Кафедра "Интеллектуальные системы"
Mailto: m.ryskina@gmail.com
Отчеты о научно-исследовательской работе
Весна 2013, 6-й семестр
Разметка библиографических записей с помощью логических алгоритмов
Работа посвящена восстановлению библиографических записей BibTeX по их текстовому представлению, то есть выделению фрагментов, соответствующих различным полям формы BibTeX. Для сегментации записей применяется подход bag-of-words. Строится бинарная матрица объектов-признаков, где объектами являются слова, а признаками - срабатывание некоторых регулярных выражений из заданного набора. Для классификации применяется алгоритм CART, строящий бинарное решающее дерево.
Публикация
Рыскина М.Н. Разметка библиографических записей с помощью логических алгоритмов // Machinelearning.ru, 2013.