Методы анализа текстов (семинар, К.В.Воронцов)/2017-2018 год
Материал из MachineLearning.
Это семинары по анализу текстов, открытые для всех желающих. Цель - быть в курсе современных подходов в области обработки текста на естественном языке (Natural Language Processing, NLP). На каждом семинаре у нас будет доклад и свободное обсуждение. Особенно часто будем обсуждать тематическое моделирование и глубокие нейронные сети. Короткая ссылка на эту страницу: bit.ly/2k3pGiJ
Где и когда
Спецсеминар проводится по средам в 19.20 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2). Проход строго по спискам. Записаться нужно здесь. А потом придти на проходную около шлагбаума (не главный вход в Мамонтов) и показать паспорт.
Контакты
Слэк topicnet.slack.com -- тусовка людей, которые занимаются NLP, читают статьи, делятся друг с другом ссылками на интересные посты и датасеты.
Группа artm_dev at googlegroups.com -- рассылка для студентов и аспирантов К.В. Воронцова, а также всех, кто как-то связан с проектом bigartm.org. Когда посылаете запрос на добавление, в "причине" напишите пару слов о себе.
Почта anna.a.potapenko at gmail.com -- пишите с предложениями и вопросами про семинар.
Расписание
Дата | Тема | Докладчик | Материалы |
---|---|---|---|
16 августа | Как вылезти из танка? | Анна Потапенко | Про Google и про ACL |
30 августа | Нейросетевые диалоговые системы в iPavlov
Задачи NER (РИС!) и Paraphrasing. | Михаил Бурцев и команда | Три презентации, clickable :) |
6 сентября | Разборы статей: Google Vizier, Exploratory Search | Роман Дербаносов, Дарья Соболева, Анастасия Янина | Презентация про Vizier
[1], Pulp: A system for exploratory search of scientific literature [2], Twitter-Network Topic Model: A Full Bayesian Treatment for Social Network and Text Modeling |
13 сентября | Вместо семинара воркшоп в вышке,
нужно зарегистрироваться | ||
20 сентября | — Как устроены рекомендательные системы
— Особенности ведения прикладных проектов | Виктор Кантор | Рекомендательные системы |
27 сентября | — Разбор статьи StarSpace: Emded all the things!
— Как устроены Question Answering системы | — Артем Попов
— Сергей Юдин | StarSpace |
4 октября | — Проблема определения числа тем в тематических моделях.
— Термодинамический подход к результатам тематического моделирования. | — Константин Воронцов
— Сергей Кольцов | |
??? | Sequence2sequence learning, attention, neural machine translation, summarization. | Анна Потапенко | An overview of gradient descent optimization algorithms
Stronger Baselines for Trustable Results in Neural Machine Translation |
??? | Word embeddings (обзор статей Aurora, статей с ACL-2017 и гибридов с тематическим моделированием) | Никита Шаповалов, Артем Попов |