Участник:Ryskina

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: Рыскина М.Н. '''МФТИ''', '''ФУПМ''' Кафедра '''"Интеллектуальные системы"''' Mailto: m.ryskina@gmail.com)
Строка 6: Строка 6:
Mailto: m.ryskina@gmail.com
Mailto: m.ryskina@gmail.com
 +
 +
== Отчеты о научно-исследовательской работе ==
 +
 +
=== Весна 2013, 6-й семестр ===
 +
 +
'''Разметка библиографических записей с помощью логических алгоритмов'''
 +
 +
''Работа посвящена восстановлению библиографических записей BibTeX по их текстовому представлению, то есть выделению фрагментов, соответствующих различным полям формы BibTeX. Для сегментации записей применяется подход bag-of-words. Строится бинарная матрица объектов-признаков, где объектами являются слова, а признаками - срабатывание некоторых регулярных выражений из заданного набора. Для классификации применяется алгоритм CART, строящий бинарное решающее дерево.''
 +
 +
'''Публикация'''
 +
 +
''Рыскина М.Н.''
 +
[http://svn.code.sf.net/p/mlalgorithms/code/Ryskina2013Txt2Bib/doc/Ryskina2013Txt2Bib.pdf Разметка библиографических записей с помощью логических алгоритмов]'' // Machinelearning.ru, 2013.''

Версия 17:48, 29 августа 2013

Рыскина М.Н.

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Mailto: m.ryskina@gmail.com

Отчеты о научно-исследовательской работе

Весна 2013, 6-й семестр

Разметка библиографических записей с помощью логических алгоритмов

Работа посвящена восстановлению библиографических записей BibTeX по их текстовому представлению, то есть выделению фрагментов, соответствующих различным полям формы BibTeX. Для сегментации записей применяется подход bag-of-words. Строится бинарная матрица объектов-признаков, где объектами являются слова, а признаками - срабатывание некоторых регулярных выражений из заданного набора. Для классификации применяется алгоритм CART, строящий бинарное решающее дерево.

Публикация

Рыскина М.Н. Разметка библиографических записей с помощью логических алгоритмов // Machinelearning.ru, 2013.

Личные инструменты