Методы анализа текстов (семинар, К.В.Воронцов)

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

Семинары научной группы К.В. Воронцова по анализу текстов (Natural Language Processing, NLP). Разбираем современные статьи из области NLP, работы студентов и приглашенных докладчиков.

Содержание

1 Где и когда
2 Контакты и ссылки
3 Расписание (осень 2018)
4 Подстраницы: семинары прошлых лет

Где и когда

По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории Гарвард. Приходить на проходную с обратной стороны Мамонтова (вот сюда) с паспортом.

Проход строго по спискам. Записаться на осенний семестр 2018 года нужно здесь. Внимание: чтобы ваша фамилия оказалась на охране, записаться нужно не позднее вечера вторника.

Контакты и ссылки

Канал в телеграме: NLP_weekly

По всем вопросам: anna.a.potapenko at gmail.com

https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.

https://goo.gl/rc4grq — короткая ссылка на страницу 2017-2018 учебного года.

Расписание (осень 2018)

Дата	Тема	Докладчик	Материалы
12 сентября	Обзор статей ACL-2018. Разбор статьи Universal Language Model Fine-tuning for Text Classification	Михаил Архипов (IPavlov)	Презентация
19 сентября	1. Order-embeddings and hyperbolic deep learning 2. Multitask learning in NLP: from 2008 to 2018	1. Роман Дербаносов 2. Татьяна Савельева (Яндекс)	1. Hyperbolic embeddings. Презентация Статьи: 1 2 3 4 2. Multitask learning. Презентация Статьи: 1 2
26 сентября	Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка."	Валентин Малых (МФТИ)	Презентация Черновик автореферата
3 октября	Извлечение семантических фреймов и смыслов слов с использованием векторных представлений	Александр Панченко (Университет Гамбурга)	Публикации в основе доклада: 1. ACL-2017 paper, 2. ACL-2018 paper, 3. Rep4NLP workshop 2016 (best paper)
10 октября	Векторные представления предложений. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д.	Николай Скачков (ВМК МГУ)	Презентация
17 октября	Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты.	Антон Бахтин (Facebook Research)	Презентация
24 октября	Эрмитовы векторные представления слов.	Алексей Зобнин (Яндекс)
31 октября	Variational autoencoder. Гибридные модели VAE+LDA.	Коля Шаталов, Настя Фадеева.	Слайды VAE, слайды VAE-LDA Статьи: 1, 2, 3
7 ноября	Goal-oriented dialogue systems.	Никита Юдин, Саша Волохова	Презентация Статьи: 1, 2.
14 ноября	Модели на основе трансформера: BERT и LISA.	Татьяна Савельева, Ксения Вальчук	Статьи: BERT , LISA Презентация: BERT, LISA
21 ноября	Hyperbolic embeddings - с кодом и примерами.	Геннадий Штех
28 ноября	Разборы статей EMNLP-2018	Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев	Статьи: Unsupervised MT, Adversarial learning, Кросс-лингвистический парсинг. Презентации: 1, 2, 3
5 декабря	Язык и мозг: как все устроено	Анастасия Лопухина (Центр языка и мозга, ВШЭ)	Презентация
12 декабря	Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте.	Николай Кругликов, Павел Поляков.

Подстраницы: семинары прошлых лет

Методы анализа текстов (семинар, К.В.Воронцов)/2017-2018 год

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4%D1%8B_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2_%28%D1%81%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%2C_%D0%9A.%D0%92.%D0%92%D0%BE%D1%80%D0%BE%D0%BD%D1%86%D0%BE%D0%B2%29»

Категория: Учебные курсы

@@ Строка 48: / Строка 48: @@
 | Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка."
 | Валентин Малых (МФТИ)
-| [https://drive.google.com/open?id=1rZg4B220m2ZnYqw_HOp-GvhTmQGGcxbM Слайды]
+| [https://drive.google.com/open?id=1rZg4B220m2ZnYqw_HOp-GvhTmQGGcxbM Презентация]
 [https://drive.google.com/open?id=1Jt6EvPtDU__7_6uaIWELzaonF0weD9rW Черновик автореферата]
 |- <!-- Конец записи -->
@@ Строка 71: / Строка 71: @@
 |-
 | 17 октября
-| Распознавание речи: история, HMM-GMM, CTC.
+| Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты.
 | Антон Бахтин (Facebook Research)
-|
+| [https://yadi.sk/i/61IONRiwOHeDhw Презентация]
 |- <!-- Конец записи -->
 |- <!-- Новая запись -->
@@ Строка 87: / Строка 87: @@
 | Variational autoencoder.  Гибридные модели VAE+LDA.
 | Коля Шаталов, Настя Фадеева.
-| Статьи: [https://arxiv.org/pdf/1703.01488.pdf 1], [https://arxiv.org/pdf/1809.03664.pdf 2], [https://arxiv.org/pdf/1706.00359.pdf 3]
+| [https://drive.google.com/open?id=1aeFiEO3yoLjSVlCRgsH4q9Kjrh32Ujcn Слайды VAE],  [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUD слайды VAE-LDA]
+Статьи: [https://arxiv.org/pdf/1703.01488.pdf 1], [https://arxiv.org/pdf/1809.03664.pdf 2], [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUDhttps://arxiv.org/pdf/1706.00359.pdf 3]
+|- <!-- Конец записи -->
+|- <!-- Новая запись -->
+|-
+| 7 ноября
+| Goal-oriented dialogue systems.
+| Никита Юдин, Саша Волохова
+| [https://drive.google.com/open?id=1WlLQYuF6Ozv7DYIFIIXoiYXRuaBa3gVQ Презентация]
+Статьи: [http://proceedings.mlr.press/v80/yarats18a/yarats18a.pdf 1], [https://arxiv.org/abs/1802.03881 2].
+|- <!-- Конец записи -->
+|- <!-- Новая запись -->
+|-
+| 14 ноября
+| Модели на основе трансформера: BERT и LISA.
+| Татьяна Савельева, Ксения Вальчук
+| Статьи: [https://arxiv.org/abs/1810.04805 BERT] , [https://arxiv.org/abs/1804.08199 LISA]
+Презентация: [https://drive.google.com/open?id=1gpvHuRO9RrQV1Nv-C392QxmVjpjlu8xM BERT], [https://drive.google.com/open?id=1MnD20aT-gHxPc8YmrBsmWpiW8nScYlpu LISA]
+|- <!-- Конец записи -->
+|- <!-- Новая запись -->
+|-
+| 21 ноября
+| Hyperbolic embeddings - с кодом и примерами.
+| Геннадий Штех
+|
+|- <!-- Конец записи -->
+|- <!-- Новая запись -->
+|-
+| 28 ноября
+| Разборы статей EMNLP-2018
+| Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев
+| Статьи: [https://arxiv.org/abs/1804.07755 Unsupervised MT], [http://aclweb.org/anthology/D18-1002 Adversarial learning], [http://aclweb.org/anthology/W18-6017 Кросс-лингвистический парсинг].
+Презентации: [https://drive.google.com/open?id=1euQk0-moNb8oLc1_r-1TDSrimZqN6dSt 1], [https://drive.google.com/open?id=146iLX0f1kJDNvi7XSaZ6xhfsBDD0P3To 2], [https://drive.google.com/open?id=18ALcpsql-iMGQwOR0qs2pPf7dMYxXGYD 3]
+|- <!-- Конец записи -->
+|- <!-- Новая запись -->
+|-
+| 5 декабря
+| Язык и мозг: как все устроено
+| Анастасия Лопухина (Центр языка и мозга, ВШЭ)
+| [https://drive.google.com/open?id=1q3mzutRGAZ8b_4ESCMiP6x8uDhqTawGM Презентация]
+|- <!-- Конец записи -->
+|- <!-- Новая запись -->
+|-
+| 12 декабря
+| Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте.
+| Николай Кругликов, Павел Поляков.
+|
 |- <!-- Конец записи -->
 |}

Методы анализа текстов (семинар, К.В.Воронцов)

Материал из MachineLearning.

Текущая версия

Содержание

Где и когда

Контакты и ссылки

Расписание (осень 2018)

Подстраницы: семинары прошлых лет

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты