Участник:Ryskina
Материал из MachineLearning.
(Различия между версиями)
Строка 3: | Строка 3: | ||
МФТИ, ФУПМ, 074 | МФТИ, ФУПМ, 074 | ||
- | Кафедра | + | Кафедра "Интеллектуальные системы" |
Mailto: m.ryskina@gmail.com | Mailto: m.ryskina@gmail.com |
Версия 17:51, 29 августа 2013
Рыскина М.Н.
МФТИ, ФУПМ, 074
Кафедра "Интеллектуальные системы"
Mailto: m.ryskina@gmail.com
Отчеты о научно-исследовательской работе
Весна 2013, 6-й семестр
Разметка библиографических записей с помощью логических алгоритмов
Работа посвящена восстановлению библиографических записей BibTeX по их текстовому представлению, то есть выделению фрагментов, соответствующих различным полям формы BibTeX. Для сегментации записей применяется подход bag-of-words. Строится бинарная матрица объектов-признаков, где объектами являются слова, а признаками - срабатывание некоторых регулярных выражений из заданного набора. Для классификации применяется алгоритм CART, строящий бинарное решающее дерево.
Публикация
Рыскина М.Н. Разметка библиографических записей с помощью логических алгоритмов // Machinelearning.ru, 2013.