Участник:Кулунчаков

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Весна 2014, 6-й семестр)
(Осень 2014, 7-й семестр)
Строка 24: Строка 24:
В работе решается проблема поиска ранжирующей функции в задачах информационного поиска. Ранжирующая функция используется для оценки релевантности документа согласно поступающему текстовому запросу. Выборка содержит набор текстовых коллекций документов, которые экспертно-отранжированы согласно релевантности некоторым заданным запросам. Цель работы - получить новые ранжирующие функции, которые будут описывать эти данные статистически не менее точно, чем традиционно используемые ранжирующие функции. Предлагается искать такие функции в виде суперпозиций, порожденных заданной грамматикой. Для этого используется итеративный алгоритм направленного поиска таких суперпозиций, отличный от переборного. При этом будет показана оптимальность решения в некоторой его окрестности относительно выбранной метрики на моделях. Также с использованием метрики на данных будет показана окрестность данных, где найденное решение будет оптимальным.
В работе решается проблема поиска ранжирующей функции в задачах информационного поиска. Ранжирующая функция используется для оценки релевантности документа согласно поступающему текстовому запросу. Выборка содержит набор текстовых коллекций документов, которые экспертно-отранжированы согласно релевантности некоторым заданным запросам. Цель работы - получить новые ранжирующие функции, которые будут описывать эти данные статистически не менее точно, чем традиционно используемые ранжирующие функции. Предлагается искать такие функции в виде суперпозиций, порожденных заданной грамматикой. Для этого используется итеративный алгоритм направленного поиска таких суперпозиций, отличный от переборного. При этом будет показана оптимальность решения в некоторой его окрестности относительно выбранной метрики на моделях. Также с использованием метрики на данных будет показана окрестность данных, где найденное решение будет оптимальным.
 +
 +
'''Доклад на соискание гранта'''
 +
 +
''Кулунчаков А.С.'' Разработка программного обеспечения для увеличения релевантности выдачи документов в задаче информационного поиска // "Умник", МФТИ, осень 2014.
'''Публикация'''
'''Публикация'''
''Кулунчаков А.С., Стрижов В.В.'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014RankinBySimpleFun/doc/Kulunchakov2014RankinBySimpleFun.pdf?format=raw Ранжирование документов с помощью структурно-простых моделей] // [http://www.elsevier.com/ Elsevier] , 2015 (готовится к подаче).
''Кулунчаков А.С., Стрижов В.В.'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014RankinBySimpleFun/doc/Kulunchakov2014RankinBySimpleFun.pdf?format=raw Ранжирование документов с помощью структурно-простых моделей] // [http://www.elsevier.com/ Elsevier] , 2015 (готовится к подаче).

Версия 12:04, 30 декабря 2014

Кулунчаков Андрей Сергеевич

МФТИ, ФУПМ, 174 группа

Кафедра "Интеллектуальные системы"

kulu-andrej@yandex.ru

Отчет о научно-исследовательской работе

Весна 2014, 6-й семестр

Обнаружение изоморфных структур существенно нелинейных прогностических моделей

В данной работе исследуется алгоритм поиска изоморфных подграфов для деревьев, отличный от переборного. Алгоритм позволяет разбивать вершины дерева на классы эквивалентности, индуцированные изоморфизмом поддеревьев с корнями в этих вершинах — корни изоморфных поддеревьев лежат в одном классе. Это позволяет сокращать размерность вектора параметров регрессионной модели, если представлять ее в виде ориентированного дерева и унифицировать параметры в каждой из его изоморфных веток. Также осуществляется замена подграфов дерева суперпозиции на изоморфные им и имеющие меньшую структурную сложность — это позволяет уменьшить структурную сложность всей модели. Оценивается сложность проверки изоморфности двух суперпозиций для предложенного и переборного алгоритмов. Выводится добавка к сложности алгоритма в случае выявления правил замены. По синтетическим данным и данным по биржевым опционам индуктивно порождаются регрессионные модели с помощью алгоритма MVR Composer. Показано уменьшение значения функционала качества этих моделей после упрощения. Демонстрируется неухудшение приближаемости моделью контрольной выборки. Показана вычислительная эффективность предложенного алгоритма в сравнении с исходным для эволюций с достаточной плотностью упрощаемых алгоритмом моделей. Сравнивается доля упрощаемых алгоритмом моделей в эволюции для алгоритма MVR Composer и переборного алгоритма генерирования моделей.

Публикация

Кулунчаков А.С., Стрижов В.В. Обнаружение изоморфных структур существенно нелинейных прогностических моделей // Intelligent Data Analysis, 2014 (подготовлено к подаче).

Осень 2014, 7-й семестр

Ранжирование документов с помощью структурно-простых моделей

В работе решается проблема поиска ранжирующей функции в задачах информационного поиска. Ранжирующая функция используется для оценки релевантности документа согласно поступающему текстовому запросу. Выборка содержит набор текстовых коллекций документов, которые экспертно-отранжированы согласно релевантности некоторым заданным запросам. Цель работы - получить новые ранжирующие функции, которые будут описывать эти данные статистически не менее точно, чем традиционно используемые ранжирующие функции. Предлагается искать такие функции в виде суперпозиций, порожденных заданной грамматикой. Для этого используется итеративный алгоритм направленного поиска таких суперпозиций, отличный от переборного. При этом будет показана оптимальность решения в некоторой его окрестности относительно выбранной метрики на моделях. Также с использованием метрики на данных будет показана окрестность данных, где найденное решение будет оптимальным.

Доклад на соискание гранта

Кулунчаков А.С. Разработка программного обеспечения для увеличения релевантности выдачи документов в задаче информационного поиска // "Умник", МФТИ, осень 2014.

Публикация

Кулунчаков А.С., Стрижов В.В. Ранжирование документов с помощью структурно-простых моделей // Elsevier , 2015 (готовится к подаче).

Личные инструменты