Участник:Кулунчаков
Материал из MachineLearning.
(→Весна 2014, 6-й семестр) |
(→Весна 2014, 6-й семестр) |
||
Строка 18: | Строка 18: | ||
''Кулунчаков А.С., Стрижов В.В.'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014IsomorphicStructures/doc/Kulunchakov2014IsomorphicStructures.pdf?format=raw Обнаружение изоморфных структур существенно нелинейных прогностических моделей] // [http://www.iospress.nl/journal/intelligent-data-analysis/ Intelligent Data Analysis], 2014 (подготовлено к подаче). | ''Кулунчаков А.С., Стрижов В.В.'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014IsomorphicStructures/doc/Kulunchakov2014IsomorphicStructures.pdf?format=raw Обнаружение изоморфных структур существенно нелинейных прогностических моделей] // [http://www.iospress.nl/journal/intelligent-data-analysis/ Intelligent Data Analysis], 2014 (подготовлено к подаче). | ||
+ | |||
+ | === Осень 2014, 7-й семестр === | ||
+ | |||
+ | '''Ранжирование документов с помощью структурно-простых моделей''' | ||
+ | |||
+ | В работе решается проблема поиска ранжирующей функции в задачах информационного поиска. Ранжирующая функция используется для оценки релевантности документа согласно поступающему текстовому запросу. Выборка содержит набор текстовых коллекций документов, которые экспертно-отранжированы согласно релевантности некоторым заданным запросам. Цель работы - получить новые ранжирующие функции, которые будут описывать эти данные статистически не менее точно, чем традиционно используемые ранжирующие функции. Предлагается искать такие функции в виде суперпозиций, порожденных заданной грамматикой. Для этого используется итеративный алгоритм направленного поиска таких суперпозиций, отличный от переборного. При этом будет показана оптимальность решения в некоторой его окрестности относительно выбранной метрики на моделях. Также с использованием метрики на данных будет показана окрестность данных, где найденное решение будет оптимальным. | ||
+ | |||
+ | '''Публикация''' | ||
+ | |||
+ | ''Кулунчаков А.С., Стрижов В.В.'' [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014RankinBySimpleFun/doc/Kulunchakov2014RankinBySimpleFun.pdf?format=raw Ранжирование документов с помощью структурно-простых моделей] // [http://www.elsevier.com/ Elsevier] , 2015 (готовится к подаче). |
Версия 11:04, 30 декабря 2014
Кулунчаков Андрей Сергеевич
МФТИ, ФУПМ, 174 группа
Кафедра "Интеллектуальные системы"
kulu-andrej@yandex.ru
Отчет о научно-исследовательской работе
Весна 2014, 6-й семестр
Обнаружение изоморфных структур существенно нелинейных прогностических моделей
В данной работе исследуется алгоритм поиска изоморфных подграфов для деревьев, отличный от переборного. Алгоритм позволяет разбивать вершины дерева на классы эквивалентности, индуцированные изоморфизмом поддеревьев с корнями в этих вершинах — корни изоморфных поддеревьев лежат в одном классе. Это позволяет сокращать размерность вектора параметров регрессионной модели, если представлять ее в виде ориентированного дерева и унифицировать параметры в каждой из его изоморфных веток. Также осуществляется замена подграфов дерева суперпозиции на изоморфные им и имеющие меньшую структурную сложность — это позволяет уменьшить структурную сложность всей модели. Оценивается сложность проверки изоморфности двух суперпозиций для предложенного и переборного алгоритмов. Выводится добавка к сложности алгоритма в случае выявления правил замены. По синтетическим данным и данным по биржевым опционам индуктивно порождаются регрессионные модели с помощью алгоритма MVR Composer. Показано уменьшение значения функционала качества этих моделей после упрощения. Демонстрируется неухудшение приближаемости моделью контрольной выборки. Показана вычислительная эффективность предложенного алгоритма в сравнении с исходным для эволюций с достаточной плотностью упрощаемых алгоритмом моделей. Сравнивается доля упрощаемых алгоритмом моделей в эволюции для алгоритма MVR Composer и переборного алгоритма генерирования моделей.
Публикация
Кулунчаков А.С., Стрижов В.В. Обнаружение изоморфных структур существенно нелинейных прогностических моделей // Intelligent Data Analysis, 2014 (подготовлено к подаче).
Осень 2014, 7-й семестр
Ранжирование документов с помощью структурно-простых моделей
В работе решается проблема поиска ранжирующей функции в задачах информационного поиска. Ранжирующая функция используется для оценки релевантности документа согласно поступающему текстовому запросу. Выборка содержит набор текстовых коллекций документов, которые экспертно-отранжированы согласно релевантности некоторым заданным запросам. Цель работы - получить новые ранжирующие функции, которые будут описывать эти данные статистически не менее точно, чем традиционно используемые ранжирующие функции. Предлагается искать такие функции в виде суперпозиций, порожденных заданной грамматикой. Для этого используется итеративный алгоритм направленного поиска таких суперпозиций, отличный от переборного. При этом будет показана оптимальность решения в некоторой его окрестности относительно выбранной метрики на моделях. Также с использованием метрики на данных будет показана окрестность данных, где найденное решение будет оптимальным.
Публикация
Кулунчаков А.С., Стрижов В.В. Ранжирование документов с помощью структурно-простых моделей // Elsevier , 2015 (готовится к подаче).