Участник:Mamonov
Материал из MachineLearning.
Кирилл Мамонов
4 курс факультета инноваций и высоких технологий МФТИ
Кафедра анализа данных Яндекса
mamonov.kr@phystech.edu
Осень 2019
Карта оптимизма новостей России
В работе описана процедура, позволяющая анализировать эмоциональную окраску (или тональность) новостных сообщений для дальнейшей оценки «регионального уровня оптимизма». Результаты оценки визуализированы на интерактивной карте России, которая отражает региональный уровень оптимизма и его изменение во времени. Работа носит как научный, так и практический характер, поскольку в ней описана процедура по эффективному извлечению информации из новостей, а также анализ их тональности с дальнейшей визуализацией.
Выступление на конференции: IV Международная научно-практическая конференция «Актуальные проблемы и перспективы развития радиотехнических и инфокоммуникационных систем» «РАДИОИНФОКОМ — 2019»
Материалы: Paper
Весна 2020
Нелинейное ранжирование результатов разведочного информационного поиска
Имея коллекцию документов, пользователю порой очень сложно в них разобраться. Существует множество подходов для поиска среди этих документов, но их недостаточно, когда пользователь хочет получить доступ к соответствующим документам в некотором логическом порядке, например, для учебных целей. В данной работе описан алгоритм ранжирования документов от простого к сложному, от общего к частному, то есть в том порядке, в котором пользователю будет легче разбираться в новой для него тематической области. Данный подход даёт пользователю абсолютно новый способ потребления контента.
Материалы: GitHub Paper Slides Video
Aspect-Based Sentiment Analysis
Командный проект в рамках курса DL in NLP 2020. Решается задача с соревнования. Сначала решалась задача E (Aspect Based Sentiment Analysis), а затем по просьбе организаторов переключились на задачу C (Aspect-Target Sentiment Classification). Задача заключается в том, чтобы определить тональность предложения/текста относительно заданного аспекта.
Minimizing total weighted tardiness on a single machine with release dates and equal-length jobs
This paper investigates the impact of the different heuristics and variations of Branch-And-Bound algorithm on the solving rate of total weighted tardiness problem. We study the problem of scheduling n jobs with release dates, due dates, weights, and equal processing times on a single machine. The objective is to minimize total weighted tardiness. The same approach also holds for the single-machine problems of minimizing the sum of weighted late jobs (1|rj ,pj = p| ∑wj Uj ) and the sum of weighted late work (1|rj ,pj = p| ∑ wjVj ) as well as their respective variants with m identical, parallel machines.
Материалы: Slides