Участник:Камиль

Материал из MachineLearning.

Перейти к: навигация, поиск

Научно-исследовательская работа

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

kamilsafin.95@gmail.com


Весна 2016, 6-й семестр

Определение заимствований в тексте без указания источника.

Работа посвящена поиску внутренних заимствований в тексте. Предполагается, что большая часть текста написана одним автором. Необходимо выделить участки текста, написанные другим автором, если таковые имеются. При этом документ анализируется изолированно, то есть источники заимствований неизвестны. В работе предлагается алгоритм, строящий статистику сегментов текста, по которой определяется факт зависимости. Эксперимент проводится на коллекции конкурса PAN-2011.

Публикации

К.Ф. Сафин, М.П. Кузнецов, М.В. Кузнецова Определение заимствований в тексте без указания источника. // Подана в журнал "Информатика и ее приложения"

Конференции

К.Ф. Сафин Определение заимствований в тексте без указания источника. "59-я научная конференция МФТИ"

Личные инструменты