Участник:Rgazizullina
Материал из MachineLearning.
м (→Отчет о научно-исследовательской работе) |
м (→Отчет о научно-исследовательской работе) |
||
(1 промежуточная версия не показана) | |||
Строка 26: | Строка 26: | ||
'''Извлечение семантических отношений из неструктурированных данных''' | '''Извлечение семантических отношений из неструктурированных данных''' | ||
- | '' | + | ''Рассмотрена задача извлечения семантических отношений из неструктурированных данных. Была разработана программа, на вход которой подается промаркированный новостной поток. Предлагалось по неструктурированным данным (новостному потоку КиноПоиска) определять состоят ли Именованные Сущности в отношении "актёр-фильм". Данный метод позволяет заменить дорогостоящее хранение и создание баз данных. Планируется использование данной работы в создании вопросно-ответной системы. '' |
+ | |||
+ | |||
+ | Публикация | ||
+ | |||
+ | Газизуллина Р.К. [http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Gazizullina2014RelationExtraction/doc/Gazizullina2014RelationExtraction.doc?format=raw Извлечение семантических отношений из неструктурированных данных], Технический отчёт // Сервер вычислительных экспериментов mvr.jmlda.org |
Текущая версия
Газизуллина Римма Камилевна МФТИ, ФУПМ, 174 группа
Отчет о научно-исследовательской работе
Весна 2014, 6-й семестр
Прогнозирование объемов железнодорожных грузоперевозок по парам веток
Работа посвящена исследованию алгоритма непараметрического прогнозирования объемов железнодорожных грузоперевозок. Рассматривается задача прогнозирования количества вагонов с различными грузами, следующих по различным маршрутам. Задана топология железнодорожной сети — для всех возможных пар железнодорожных веток дана информация о всех блоках вагонов, совершивших переезд с одной ветки на другую, включая количество вагонов в блоке, вид груза и дату прохождения маршрута. Для построения прогноза используется алгоритм, основанный на свертке эмпирической плотности распределения значений временного ряда с функцией потерь. Ранее прогноз выполнялся для каждого железнодорожного узла в отдельности. Предлагается повысить качество прогноза за счет прогнозирования по парам веток вместо прогнозирования отправления всех вагонов с данного узла. Алгоритм проиллюстрирован посуточными данными за полтора года о перевозках 38 типов грузов.
Подготовлена статья:
• Газизуллина Р.К., Стенина М.М., Стрижов В.В. Прогнозирование объемов железнодорожных грузоперевозок по парам веток // Системы и средства информатики. —- 2014 (подано в редакцию)
Осень 2014, 7-й семестр
Извлечение семантических отношений из неструктурированных данных
Рассмотрена задача извлечения семантических отношений из неструктурированных данных. Была разработана программа, на вход которой подается промаркированный новостной поток. Предлагалось по неструктурированным данным (новостному потоку КиноПоиска) определять состоят ли Именованные Сущности в отношении "актёр-фильм". Данный метод позволяет заменить дорогостоящее хранение и создание баз данных. Планируется использование данной работы в создании вопросно-ответной системы.
Публикация
Газизуллина Р.К. Извлечение семантических отношений из неструктурированных данных, Технический отчёт // Сервер вычислительных экспериментов mvr.jmlda.org