Методы анализа текстов (семинар, К.В.Воронцов)
Материал из MachineLearning.
(→Расписание (осень 2018)) |
м (→Расписание (осень 2018)) |
||
(19 промежуточных версий не показаны.) | |||
Строка 48: | Строка 48: | ||
| Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка." | | Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка." | ||
| Валентин Малых (МФТИ) | | Валентин Малых (МФТИ) | ||
- | | [https://drive.google.com/open?id=1rZg4B220m2ZnYqw_HOp-GvhTmQGGcxbM | + | | [https://drive.google.com/open?id=1rZg4B220m2ZnYqw_HOp-GvhTmQGGcxbM Презентация] |
[https://drive.google.com/open?id=1Jt6EvPtDU__7_6uaIWELzaonF0weD9rW Черновик автореферата] | [https://drive.google.com/open?id=1Jt6EvPtDU__7_6uaIWELzaonF0weD9rW Черновик автореферата] | ||
|- <!-- Конец записи --> | |- <!-- Конец записи --> | ||
Строка 71: | Строка 71: | ||
|- | |- | ||
| 17 октября | | 17 октября | ||
- | | Распознавание речи: история, HMM-GMM, CTC. | + | | Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты. |
| Антон Бахтин (Facebook Research) | | Антон Бахтин (Facebook Research) | ||
- | | | + | | [https://yadi.sk/i/61IONRiwOHeDhw Презентация] |
|- <!-- Конец записи --> | |- <!-- Конец записи --> | ||
|- <!-- Новая запись --> | |- <!-- Новая запись --> | ||
Строка 87: | Строка 87: | ||
| Variational autoencoder. Гибридные модели VAE+LDA. | | Variational autoencoder. Гибридные модели VAE+LDA. | ||
| Коля Шаталов, Настя Фадеева. | | Коля Шаталов, Настя Фадеева. | ||
- | | Статьи: [https://arxiv.org/pdf/1703.01488.pdf 1], [https://arxiv.org/pdf/1809.03664.pdf 2], [https://arxiv.org/pdf/1706.00359.pdf 3] | + | | [https://drive.google.com/open?id=1aeFiEO3yoLjSVlCRgsH4q9Kjrh32Ujcn Слайды VAE], [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUD слайды VAE-LDA] |
+ | Статьи: [https://arxiv.org/pdf/1703.01488.pdf 1], [https://arxiv.org/pdf/1809.03664.pdf 2], [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUDhttps://arxiv.org/pdf/1706.00359.pdf 3] | ||
+ | |- <!-- Конец записи --> | ||
+ | |- <!-- Новая запись --> | ||
+ | |- | ||
+ | | 7 ноября | ||
+ | | Goal-oriented dialogue systems. | ||
+ | | Никита Юдин, Саша Волохова | ||
+ | | [https://drive.google.com/open?id=1WlLQYuF6Ozv7DYIFIIXoiYXRuaBa3gVQ Презентация] | ||
+ | Статьи: [http://proceedings.mlr.press/v80/yarats18a/yarats18a.pdf 1], [https://arxiv.org/abs/1802.03881 2]. | ||
+ | |- <!-- Конец записи --> | ||
+ | |- <!-- Новая запись --> | ||
+ | |- | ||
+ | | 14 ноября | ||
+ | | Модели на основе трансформера: BERT и LISA. | ||
+ | | Татьяна Савельева, Ксения Вальчук | ||
+ | | Статьи: [https://arxiv.org/abs/1810.04805 BERT] , [https://arxiv.org/abs/1804.08199 LISA] | ||
+ | Презентация: [https://drive.google.com/open?id=1gpvHuRO9RrQV1Nv-C392QxmVjpjlu8xM BERT], [https://drive.google.com/open?id=1MnD20aT-gHxPc8YmrBsmWpiW8nScYlpu LISA] | ||
+ | |- <!-- Конец записи --> | ||
+ | |- <!-- Новая запись --> | ||
+ | |- | ||
+ | | 21 ноября | ||
+ | | Hyperbolic embeddings - с кодом и примерами. | ||
+ | | Геннадий Штех | ||
+ | | | ||
+ | |- <!-- Конец записи --> | ||
+ | |- <!-- Новая запись --> | ||
+ | |- | ||
+ | | 28 ноября | ||
+ | | Разборы статей EMNLP-2018 | ||
+ | | Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев | ||
+ | | Статьи: [https://arxiv.org/abs/1804.07755 Unsupervised MT], [http://aclweb.org/anthology/D18-1002 Adversarial learning], [http://aclweb.org/anthology/W18-6017 Кросс-лингвистический парсинг]. | ||
+ | Презентации: [https://drive.google.com/open?id=1euQk0-moNb8oLc1_r-1TDSrimZqN6dSt 1], [https://drive.google.com/open?id=146iLX0f1kJDNvi7XSaZ6xhfsBDD0P3To 2], [https://drive.google.com/open?id=18ALcpsql-iMGQwOR0qs2pPf7dMYxXGYD 3] | ||
+ | |- <!-- Конец записи --> | ||
+ | |- <!-- Новая запись --> | ||
+ | |- | ||
+ | | 5 декабря | ||
+ | | Язык и мозг: как все устроено | ||
+ | | Анастасия Лопухина (Центр языка и мозга, ВШЭ) | ||
+ | | [https://drive.google.com/open?id=1q3mzutRGAZ8b_4ESCMiP6x8uDhqTawGM Презентация] | ||
+ | |- <!-- Конец записи --> | ||
+ | |- <!-- Новая запись --> | ||
+ | |- | ||
+ | | 12 декабря | ||
+ | | Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте. | ||
+ | | Николай Кругликов, Павел Поляков. | ||
+ | | | ||
|- <!-- Конец записи --> | |- <!-- Конец записи --> | ||
|} | |} |
Текущая версия
Семинары научной группы К.В. Воронцова по анализу текстов (Natural Language Processing, NLP). Разбираем современные статьи из области NLP, работы студентов и приглашенных докладчиков.
Содержание |
Где и когда
По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории Гарвард. Приходить на проходную с обратной стороны Мамонтова (вот сюда) с паспортом.
Проход строго по спискам. Записаться на осенний семестр 2018 года нужно здесь. Внимание: чтобы ваша фамилия оказалась на охране, записаться нужно не позднее вечера вторника.
Контакты и ссылки
Канал в телеграме: NLP_weekly
По всем вопросам: anna.a.potapenko at gmail.com
https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.
https://goo.gl/rc4grq — короткая ссылка на страницу 2017-2018 учебного года.
Расписание (осень 2018)
Дата | Тема | Докладчик | Материалы |
---|---|---|---|
12 сентября | Обзор статей ACL-2018. Разбор статьи
Universal Language Model Fine-tuning for Text Classification | Михаил Архипов (IPavlov) | Презентация |
19 сентября | 1. Order-embeddings and hyperbolic deep learning
2. Multitask learning in NLP: from 2008 to 2018 | 1. Роман Дербаносов
2. Татьяна Савельева (Яндекс) | 1. Hyperbolic embeddings. Презентация Статьи: 1 2 3 4
2. Multitask learning. Презентация Статьи: 1 2 |
26 сентября | Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка." | Валентин Малых (МФТИ) | Презентация |
3 октября | Извлечение семантических фреймов и смыслов слов с использованием векторных представлений | Александр Панченко (Университет Гамбурга) | Публикации в основе доклада:
1. ACL-2017 paper, 2. ACL-2018 paper, 3. Rep4NLP workshop 2016 (best paper) |
10 октября | Векторные представления предложений. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д. | Николай Скачков (ВМК МГУ) | Презентация |
17 октября | Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты. | Антон Бахтин (Facebook Research) | Презентация |
24 октября | Эрмитовы векторные представления слов. | Алексей Зобнин (Яндекс) | |
31 октября | Variational autoencoder. Гибридные модели VAE+LDA. | Коля Шаталов, Настя Фадеева. | Слайды VAE, слайды VAE-LDA |
7 ноября | Goal-oriented dialogue systems. | Никита Юдин, Саша Волохова | Презентация |
14 ноября | Модели на основе трансформера: BERT и LISA. | Татьяна Савельева, Ксения Вальчук | Статьи: BERT , LISA |
21 ноября | Hyperbolic embeddings - с кодом и примерами. | Геннадий Штех | |
28 ноября | Разборы статей EMNLP-2018 | Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев | Статьи: Unsupervised MT, Adversarial learning, Кросс-лингвистический парсинг. |
5 декабря | Язык и мозг: как все устроено | Анастасия Лопухина (Центр языка и мозга, ВШЭ) | Презентация |
12 декабря | Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте. | Николай Кругликов, Павел Поляков. |
Подстраницы: семинары прошлых лет
Методы анализа текстов (семинар, К.В.Воронцов)/2017-2018 год |