Участник:Ryskina
Материал из MachineLearning.
(Различия между версиями)
(Новая: Рыскина М.Н. '''МФТИ''', '''ФУПМ''' Кафедра '''"Интеллектуальные системы"''' Mailto: m.ryskina@gmail.com) |
|||
Строка 6: | Строка 6: | ||
Mailto: m.ryskina@gmail.com | Mailto: m.ryskina@gmail.com | ||
+ | |||
+ | == Отчеты о научно-исследовательской работе == | ||
+ | |||
+ | === Весна 2013, 6-й семестр === | ||
+ | |||
+ | '''Разметка библиографических записей с помощью логических алгоритмов''' | ||
+ | |||
+ | ''Работа посвящена восстановлению библиографических записей BibTeX по их текстовому представлению, то есть выделению фрагментов, соответствующих различным полям формы BibTeX. Для сегментации записей применяется подход bag-of-words. Строится бинарная матрица объектов-признаков, где объектами являются слова, а признаками - срабатывание некоторых регулярных выражений из заданного набора. Для классификации применяется алгоритм CART, строящий бинарное решающее дерево.'' | ||
+ | |||
+ | '''Публикация''' | ||
+ | |||
+ | ''Рыскина М.Н.'' | ||
+ | [http://svn.code.sf.net/p/mlalgorithms/code/Ryskina2013Txt2Bib/doc/Ryskina2013Txt2Bib.pdf Разметка библиографических записей с помощью логических алгоритмов]'' // Machinelearning.ru, 2013.'' |
Версия 17:48, 29 августа 2013
Рыскина М.Н.
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Mailto: m.ryskina@gmail.com
Отчеты о научно-исследовательской работе
Весна 2013, 6-й семестр
Разметка библиографических записей с помощью логических алгоритмов
Работа посвящена восстановлению библиографических записей BibTeX по их текстовому представлению, то есть выделению фрагментов, соответствующих различным полям формы BibTeX. Для сегментации записей применяется подход bag-of-words. Строится бинарная матрица объектов-признаков, где объектами являются слова, а признаками - срабатывание некоторых регулярных выражений из заданного набора. Для классификации применяется алгоритм CART, строящий бинарное решающее дерево.
Публикация
Рыскина М.Н. Разметка библиографических записей с помощью логических алгоритмов // Machinelearning.ru, 2013.