Участник:Vokov

Материал из MachineLearning.

(Различия между версиями)

Версия 21:52, 6 июня 2024

Содержание

1 Учебные материалы
- 1.1 Курсы лекций
- 1.2 Рекомендации для студентов и аспирантов
2 Интервью, выступления, блоги
3 Доклады на конференциях и семинарах
4 Научные интересы
5 Публикации
6 Софт и проекты
7 Аспиранты и студенты
8 Cсылки
9 Мои подстраницы

Воронцов Константин Вячеславович

профессор РАН, д.ф.-м.н.,
проф., зав. каф. «Математические методы прогнозирования» ВМК МГУ,
зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ
зав. каф. «Машинного обучения и цифровой гуманитаристики» МФТИ,
проф. каф. «Интеллектуальные системы» МФТИ (см.также),
г.н.с. отдела «Интеллектуальные системы» Вычислительного центра ФИЦ ИУ РАН,
один из идеологов и Администраторов ресурса MachineLearning.RU,
подробнее — на подстранице Curriculum vitæ.

Мне можно написать письмо.

http://www.MachineLearning.ru/wiki?title=User:Vokov — короткая ссылка на эту страницу.

Учебные материалы

Курсы лекций

Машинное обучение — годовой курс, кафедра «Интеллектуальные системы» ФУПМ МФТИ и кафедра ММП ВМК МГУ.
Математические методы анализа текстов — семестровый курс, кафедра «Интеллектуальные системы» ФУПМ МФТИ и кафедра ММП ВМК МГУ
Вероятностные тематические модели — семестровый курс, кафедра «Интеллектуальные системы» ФУПМ МФТИ и спецкурс на кафедре ММП ВМК МГУ.
Теория надёжности обучения по прецедентам — спецкурс, кафедра ММП ВМК МГУ.
Прикладной статистический анализ данных — семестровый курс, кафедра ММП ВМК МГУ; альтернативный семестровый курс, ФУПМ МФТИ.

Интервью, выступления, блоги

Доклады на конференциях и семинарах

6 июня 2024. Карты знаний: усиление коллективного естественного интеллекта. Семинар русскоязычного сообщества AGI. (PNG, 1.6 МБ). Видеозапись.
27 мая 2024. Карты знаний: на пути к доверенным языковым моделям и системам представления знаний. Форум «Технологии доверенного искусственного интеллекта». (PDF, 2.8 МБ).
20 мая 2024. Эволюция идей машинного обучения от Фрэнсиса Бэкона до больших языковых моделей. Всероссийский семинар по искусственному интеллекту для студентов, аспирантов и молодых ученых. Российская ассоциация искусственного интеллекта. (PDF, 7.2 МБ). Видеозапись.
20 мая 2024. Нейросетевые языковые модели для поиска и анализа научных публикаций. XIV Международная молодежная научно-практическая конференция с элементами научной школы «Прикладная математика и фундаментальная информатика» (ПМиФИ 2024). ОмГТУ, Омск. (PDF, 2.2 МБ).
17 апреля 2024. Машина, будь человеком! Data Fusion 2024. (PDF, 5.7 МБ). Видеозапись.
17 апреля 2024. Эволюция идей искусственного интеллекта: история развития и связь с практикой. Конгресс «Молекулярная диагностика и биобезопасность-2024», секция «Эпидемиологический анализ и прогнозирование в условиях цифровой трансформации» (PDF, 4.1 МБ). Видеозапись.
12 апреля 2024. Цивилизационная идеология. Физтех-Союз, Энотека-IQ. (PNG, 2.6Мб). Видеозапись.
10 апреля 2024. Проект «Мастерская знаний». Научный семинар по анализу данных Московского городского педагогического университета. (PDF, 2.8 МБ).
10 апреля 2024. Нейросетевые модели разметки текста: от выявления манипулятивных воздействий к автоматизации контент-анализа. Международная научная конференция «Манипулятивные процессы в медиадискурсе: реальность, ментальные модели, язык», РГГУ. (PDF, 5.4 МБ).
28 марта 2024. Карты знаний: Антропоцентричная система представления знаний в будущей человеко-машинной цивилизации. Всероссийский педагогический форум «Цифровая дидактика», Всероссийская научно-практическая конференция «Сквозные технологии в преподавании физики, математики, информатики», ПГГПУ, Пермь. (PNG, 1.3 МБ). Видеозапись.
11 марта 2024. Карты знаний: усиление коллективного естественного интеллекта и шаг к безопасному гибридному интеллекту. Научный семинар Факультета государственного управления, МГУ. (PDF, 2.5 МБ). Видеозапись.
21 февраля 2024. Мастерская знаний. Научный семинар «Проблемы управления знаниями», ИПУ РАН. (PDF, 2.4 МБ). Видеозапись.
19 декабря 2023. О подготовке кадров для цифровой экономики. Круглый стол «Вызовы, риски и проблемы системы образования РФ в среднесрочной перспективе». Общественная Палата РФ. (PNG, 1.5Мб).
18 декабря 2023. Анти-Курцвейл: как думать о будущем искусственного интеллекта и о будущем вообще. Цикл научно-популярных лекций для молодёжи «Научное кафе», Тульский государственный университет. (PNG, 2.6Мб).
12 декабря 2023. О некоторых фундаментальных проблемах технологий искусственного интеллекта. Математические методы распознавания образов (конференция). (PDF, 5.3 МБ).
11 декабря 2023. Фундаментальные проблемы технологий искусственного интеллекта. Общее собрание Отделения математических наук РАН. (PDF, 5.2Мб).
8 декабря 2023. Модели векторизации текста для семантического поиска и формализации гуманитарных знаний. Международная молодежная научная конференция «Технологии ИИ в науке и образовании», МГУ. (PDF, 9.0Мб).
1 декабря 2023. Дилеммы развития искусственного интеллекта: чем заниматься — создавать возможности или устранять угрозы? Визионерская лекция. Школа прикладного анализа больших данных. Томский государственный университет. (PNG, 1.1Мб). Видеозапись.
23 ноября 2023. Цивилизационная идеология: мысли о будущем искусственного интеллекта и о будущем вообще. Лекторий «Кругозор», МГУ. (цивилизация-PNG, 67Кб), (идеология-PNG, 164Кб), (цивилизационная-идеология-PNG, 1,6Мб). Видеозапись.
23 ноября 2023. О преподавании искусственного интеллекта и машинного обучения: от школы до университета. Всероссийский съезд учителей и преподавателей математики, МГУ. (PDF, 3.0Мб). Видеозапись.
18 ноября 2023. Тематика НИР: математические методы анализа текстов и~информационного поиска. Семинар магистрантов AI Masters. (PDF, 8.3Мб).
12 ноября 2023. Профессия «искусственный интеллект, анализ данных и машинное обучение». День Открытых Дверей, ВМК МГУ. (PDF, 3.3Мб).
11 ноября 2023. Большие языковые модели для автоматизации разметки текстов. Форум «Открытые данные», Томск. Панельная сессия «Информационное воздействие. ИИ для анализа культурных кодов». (PDF, 3.3Мб).
10 ноября 2023. Сценарии использования BigARTM: тематический анализ текстовых и мультимодальных данных. Форум «Открытые данные», Томск. (PDF, 7.2Мб).
25 октября 2023. Большие языковые модели для автоматизации разметки текстов. «Цифровые международные отношения 2023», секция «ИИ в международных исследованиях», МГИМО. (PDF, 3.0Мб). Видеозапись.
24 октября 2023. Технологии искусственного интеллекта: глубокие нейронные сети, большие языковые модели, фундаментальные модели, что дальше? Научный семинар «Проблемы современных информационно-вычислительных систем», МГУ. (PNG, 2.2Мб). Видеозапись.
8 сентября 2023. Технологии искусственного интеллекта, их влияние на общество, рынок труда, образование. I Всероссийский форум руководителей финансового-экономических блоков организаций высшего образования МФТИ. (PNG, 0.9Мб). Видеозапись.
5 сентября 2023. Оптимизация на единичных симплексах для обучения тематических моделей и нейронных сетей. Научная школа «Обратные некорректные задачи и машинное обучение». (PDF, 2.4Мб).
17 августа 2023. Интерпретируемость и объяснимость моделей машинного обучения. Международный военно-технический форум «АРМИЯ-2023». Секция №4 «Научная проблематика в области искусственного интеллекта» (PDF, 2.2Мб).
12 июля 2023. Оптимизация на единичных симплексах для обучения тематических моделей и нейронных сетей. Традиционная молодежная летняя школа «Управление, информация и оптимизация» им. Б. Т. Поляка. (PDF, 2.7Мб). Видеозапись.
30 июня 2023. Унификация фрагментной разметки текста и оценивания моделей разметки для формализации гуманитарных знаний. Всемирный Конгресс «Теория систем, алгебраическая биология, искусственный интеллект: математические основы и приложения». (PDF, 3.5Мб). Видеозапись.
17 мая 2023. Задачи и технологии вероятностного тематического моделирования (к обсуждению возможностей их применения в биоинформатике). Научный семинар Института ИИ МГУ. (PDF, 7.8Мб).
26 апреля 2023. Искусственный интеллект: эволюция идей от Фрэнсиса Бэкона до векторных трансформеров и ChatGPT. «Проблемы искусственного интеллекта» — совместный научный семинар Российской ассоциации искусственного интеллекта и ФИЦ «Информатика и управление» РАН (PDF, 5.5Мб).
19 апреля 2023. Искусственный интеллект: эволюция идей от Фрэнсиса Бэкона до фундаментальных моделей и ChatGPT. Научный семинар под руководством академика РАН, профессора В.А.Садовничего, МГУ. (PDF, 4.8Мб).
10 апреля 2023. О некоторых технологиях информационного поиска в текстовых массивах. Круглый стол «Практические задачи внедрения технологий искусственного интеллекта в деятельность архивов», ВНИИДАД. (PDF, 6.7Мб).
4 апреля 2023. Технологии искусственного интеллекта и политика постправды. Взлёт.Диалоги, образовательный центр гимназии им. Е.М.Примакова. (PDF, 4.4Мб).
27 марта 2023. Mathematical methods and applications of semantic analysis of text data. Scientific Conference «New challenges facing artificial intelligence», Tsinghua University, Beijing, China. (PDF, 4.8Мб).
10 марта 2023. Технологии и приложения тематического моделирования в цифровых гуманитарных исследованиях. Методологический семинар МГИМО и ИСП РАН по анализу данных в области международных отношений. (PDF, 6.8Мб).
17 февраля 2023. Технологии искусственного интеллекта против фейков, постправды и информационных войн. Заседание Экспертного совета по развитию цифровой экономики, технологий и инноваций Молодёжного парламента при Государственной думе Федерального Собрания РФ по теме «Противодействие деструктивной идеологии (нацизм, терроризм, криминал)». (PDF, 1.7Мб).
11 февраля 2023. Тематический информационный поиск в цифровых гуманитарных исследованиях. Научный семинар «Искусственный интеллект в исторических исследованиях: автоматизированное распознавание текстов рукописных исторических источников». Ассоциация «История и компьютер», РАНХиГС. (PDF, 5.9Мб).
30 января 2023. Переосмысление вероятностных тематических моделей с позиций классической не-байесовской регуляризации. Научная конференция «Анализ данных и оптимизация», МФТИ. (PDF, 8.3Мб) — английская версия, (PDF, 8.3Мб) — русская версия.
19 января 2023. Вычислительные методы обработки естественного языка для разведочного информационного поиска, накопления, анализа и систематизации предметных знаний. Научный семинар отделения №1 ФИЦ ИУ РАН. (PDF, 4.6Мб).
7 декабря 2022. Задачи понимания естественного языка: на пути к стандартизации разметки и оценивания моделей. Секционное научно-методическое заседание «Межотраслевые вопросы стандартизации искусственного интеллекта» Подкомитета 02 «Данные» (ПК02) Технического комитета по стандартизации «Искусственный интеллект» (ТК164), в рамках конференции ИОИ-14. (PDF, 2.4Мб).
6 декабря 2022. От алгебраического подхода Ю.И.Журавлёва к ансамблированию моделей в широком смысле. Интеллектуализация обработки информации (конференция). (PDF, 2.9Мб).
28 ноября 2022. Обзор оптимизационных задач машинного обучения: от персептрона до векторных представлений сложно структурированных данных. Научный симпозиум «Искусственный интеллект и его применения». Институт ИИ МГУ. (PDF, 3.6Мб).
25 ноября 2022. Разметка данных для обучения нейросетевых моделей языка как способ формализации гуманитарных знаний. Школа прикладного анализа больших данных. Томский государственный университет. (PDF, 2.5Мб). Видеозапись.
11 ноября 2022. Разметка данных для обучения нейросетевых моделей языка как способ формализации гуманитарных знаний. XVIII научная конференция межрегиональной ассоциации «История и компьютер» Историческая информатика как Historical Data Science. (PDF, 2.5Мб).
27 октября 2022. Обзор задач искусственного интеллекта: от обучения персептрона до многокритериальной оптимизации векторных представлений сложно структурированных данных. Семинар Отделения математических наук РАН по проблемам искусственного интеллекта. (PDF, 3.7Мб). Видеозапись.
12 октября 2022. Стандартизация разметки текста и оценивания предсказательных моделей в задачах понимания естественного языка. Конгресс «Humanities vs sciences & the knowledge accelerating in modern world: parallels and interaction». (PDF, 2.2Мб). Видеозапись.
8 октября 2022. Искусственный интеллект: мифы, реальность, перспективы. Всероссийский Фестиваль «Наука 0+». (PDF, 5.1Мб).
16 августа 2022. Обучаемая векторизация данных как основа нейросетевых технологий искусственного интеллекта. Международный военно-технический форум «АРМИЯ-2022». Секция №3 «Научная проблематика в области искусственного интеллекта» (PDF, 4.8Мб).
20 мая 2022. Технологии искусственного интеллекта и безопасность информационного пространства. Международный конгресс Университетского консорциума исследователей больших данных. г.Киров, ВятГУ. (PDF, 1.7Мб). Видеозапись.
20 мая 2022. Технологии искусственного интеллекта против фейков, постправды и информационных войн. Заседание Экспертного совета по развитию цифровой экономики, технологий и инноваций Молодёжного парламента при Государственной думе Федерального Собрания РФ по теме «Защита суверенного информационного пространства: правовые, научно-технические и организационные меры». (PDF, 1.6Мб).
18 мая 2022. Вероятностные тематические модели: от теории регуляризации к моделям внимания. XII Международная молодёжная научно-практическая конференция с элементами научной школы «Прикладная математика и фундаментальная информатика». Омский ГТУ. (PDF, 7.1Мб).
17 мая 2022. Современные методы и проблемы тематического моделирования и разведочного поиска. Ежегодная конференция Российской библиотечной ассоциации XXVI. Совместное заседание: секция 08/11 по автоматизации, форматам и каталогизации 23-К. (PDF, 1.7Мб). Видеозапись.
14 апреля 2022. Технологии искусственного интеллекта против политики постправды. Международная научно-практическая конференция «Цифровые международные отношения». Секция «Машинный анализ естественного языка в международных отношениях». (PDF, 1.5Мб). Видеозапись.
17 марта 2022. Тематическое моделирование для информационного поиска. Научный семинар Центра прикладного анализа больших данных Томского государственного университета. (PDF, 2.7Мб). Видеозапись.
31 января 2022. Задачи выявления речевых манипуляций и поляризации общественного мнения в новостных текстах. Научный семинар Центра прикладного анализа больших данных Томского государственного университета. (PDF, 1.1Мб). Видеозапись.
7 января 2022. STEM-дисциплины (Science, Technology, Engineering, Math) – основа настоящего образования? Московская школа управления СКОЛКОВО, Образовательный интенсив «Ты. Университет. Будущее». (PDF, 2.8Мб).
13 декабря 2021. Математические методы понимания естественного языка для мониторинга медиа-пространства. Заседание Общего собрания Отделения математических наук Российской академии наук «Современные математические проблемы искусственного интеллекта». (PDF, 2.8Мб).
7 декабря 2021. Задачи и методы понимания естественного языка для мониторинга медиа-пространства. Математические методы распознавания образов (конференция). (PDF, 2.3 МБ). Видеозапись.
23 ноября 2021. Технологии искусственного интеллекта и безопасность информационного пространства. Заседание Президиума Российской академии наук «Искусственный интеллект в контексте информационной безопасности». (PDF, 1.4Мб). Видеозапись.
29 октября 2021. Обзор оптимизационных задач машинного обучения. Smart Computational Methods in Continuum Mechanics. Конференция памяти академика О.М.Белоцерковского, МФТИ. (PDF, 1.8Мб). (PDF, 1.8Мб, на английском).
24 августа 2021. Фундаментальные основы технологий ИИ. Международный военно-технический форум «АРМИЯ-2021». Секция №2: Отечественная научная школа и научно-технологический потенциал в области искусственного интеллекта. Вопросы подготовки кадров. (PDF, 3.9Мб).
8 июля 2021. Обзор оптимизационных задач машинного обучения. Школа по современной комбинаторике и теории игр, Кавказский математический центр Адыгейского государственного университета. (PDF, 4.4Мб). Видеозапись.
10 июня 2021. Оценивание рисков распространения эпидемии по графу контактов методами имитационного моделирования и машинного обучения. Круглый стол «Компьютерные симуляции в исследовании макроэкономических процессов». (PDF, 1.2Мб). Видеозапись.
28 мая 2021. Искусственный интеллект в цифровых гуманитарных исследованиях. Международный коллоквиум «Искусственный интеллект. Гуманитарные науки. Концепция ЮНЕСКО» на базе НГЛУ. (PDF, 3.7Мб). Видеозапись.
16 мая 2021. Концепция ЦИфровой ПлатФормы «ЦИПФ» для управления социальной и политической активностью молодежи. Российский форум «Молодёжь и наука», Университет Лобачевского, Нижний Новгород. (PDF, 1.0Мб). Видеозапись.
27 апреля 2021. Задачи и технологии понимания естественного языка: искусственный интеллект в помощь естественному. Саммит молодых ученых и инженеров «Большие вызовы для общества, государства и науки». Университет Сириус, Сочи. (PDF, 2.2Мб). Видеозапись.
8 апреля 2021. Тематическое моделирование текстовых коллекций и транзакционных данных. (PDF, 9.4Мб).
31 марта 2021. Искусственный интеллект против фейков и политики постправды: типология задач и подходов. Международная конференция DataFusion-2021. (PDF, 1.2Мб). Видеозапись.
19 февраля 2021. Байесовская и классическая регуляризация в вероятностном тематическом моделировании. Научно-образовательный семинар «Актуальные проблемы прикладной математики» Новосибирского Государственного Университета. (PDF, 2.3Мб). Видеозапись.
4 февраля 2021. Фейковые новости и другие типы потенциально опасного дискурса: типология, подходы, датасеты, соревнования. OpenTalks.AI. (PDF, 1.2Мб).
8 декабря 2020. Десять открытых проблем вероятностного тематического моделирования . Интеллектуализация обработки информации (конференция) (PDF, 1.2 МБ). Видеозапись.
4 декабря 2020. О методологии машинного обучения. Исторические исследования в контексте науки о данных: информационные ресурсы, аналитические методы и цифровые технологии. (PDF, 3.9Мб). Видеозапись.
12 ноября 2020. Искусственный интеллект и машинное обучение. В рамках мастер-класса «Машинное обучение и искусственный интеллект в инновационных проектах, лекция и разбор кейсов участников в интерактивном режиме». Университет 2030. (PDF, 2.6Мб).
23–29 августа 2020. Мини-курс «Обзор задач оптимизации в машинном обучении». Традиционная Школа «Управление, информация и оптимизация», Образовательный центр «Сириус», Сочи. Лекция 1: обучаемые модели распространения риска на графе (PDF, 0.9Мб). Лекция 2: постановки задач оптимизации в машинном обучении (PDF, 1.7Мб). Лекция 3: тематическое моделирование текстовых и транзакционных данных (PDF, 3.5Мб).
3 июня 2020. Обзор постановок оптимизационных задач машинного обучения. Общероссийский семинар по оптимизации. (PDF, 1.9 МБ). Видеозапись.
26 марта 2020. Методология машинного обучения: постановки оптимизационных задач. Лекция в МФТИ. (PDF, 1.7 МБ). Видеозапись.
19 марта 2020. История машинного обучения. Лекция в МФТИ. (PDF, 5.4 МБ). Видеозапись.
26 февраля 2020. Вероятностное тематическое моделирование больших текстовых коллекций и транзакционных данных. Научный семинар кафедры АСВК ВМК МГУ. (PDF, 2.3 МБ).
5 декабря 2019. Моделирование и искусственный интеллект: технологии, мифы, приоритеты. Конференция «Бизнес на 100%: операционная эффективность». (PDF, 1.3 МБ).
26 ноября 2019. Задачи и методы автоматического анализа текстов в разведочном информационном поиске. Математические методы распознавания образов (конференция). (PDF, 3.8 МБ).
24 октября 2019. «Человек и Машина» — конференция о том, как люди учат машины разговаривать и понимать смыслы. Мастерская знаний: машина, которая ничего не понимает, но учит людей приобретать профессиональные знания (PDF, 2.0 МБ).
23 октября 2019. Форум Инновационного развития, Сколково. RAIF 2019, секция Natural Language Processing и осознанный диалог: распознать, понять, ответить. Мастерская знаний: поисково-рекомендательная система для систематизации профессионального контента (PDF, 1.9 МБ).
21 октября 2019. NORMENT (Norwegian Centre for Mental Disorders Research) seminar in MIPT, Moscow. Applications of topic modeling and non-negative matrix factorization (PDF, 2.2 МБ).
18 октября 2019. Открытая лекция AI Business Course, Физтех.Рост. О лаборатории машинного интеллекта МФТИ (PDF, 2.1 МБ). Тематический информационный поиск (PDF, 2.7 МБ).
11 октября 2019. Первый открытый семинар лаборатории машинного интеллекта МФТИ. О лаборатории (PDF, 2.1 МБ). О разведочном поиске (PDF, 1.1 МБ). О тематическом моделировании (PDF, 0.8 МБ). Видеозапись.
11 октября 2019. Искусственный интеллект и машинное обучение. Лекция в Высшей школе системного инжиниринга МФТИ. (PDF, 3.7 МБ).
28 сентября 2019. Искусственный интеллект и анализ данных – профессия будущего. Форсайт-сессия учителей информатики «Взгляд в будущее» (PDF, 2.3 МБ). Примеры занятий по машинному обучению со школьниками: о тестах Бонгарда (PDF, 1.0 МБ); кружок для школьников в МФТИ (PDF, 3.0 МБ); отчёт по проекту в Сочи.Сириус (PDF, 1.0 МБ).
20 сентября 2019. Тематические векторные представления текста и разведочный информационный поиск. Математический кружок школы ПМИ МФТИ. (PDF, 2.9 МБ).
19 сентября 2019. Искусственный интеллект на пальцах. Искусственный интеллект в юридической практике. (PDF, 1.9 МБ). Видеозапись
11 июля 2019. От AI-хайпа к ML-технологиям. Образовательный интенсив «Остров 10-22». (PDF, 2.6 МБ).
24 июня 2019. Искусственный интеллект и машинное обучение. Лекция в Высшей школе системного инжиниринга МФТИ. (PDF, 3.7 МБ).
11 мая 2019. BigARTM: от лего-конструктора тематических моделей к сервисам разведочного поиска. DataFest-6. (PDF, 3.1 МБ). Видеозапись.
16 апреля 2019. Тематические векторные представления текста: от «мешка слов» к моделям связного текста. Сколково.Роботикс. (PDF, 3.3 МБ).
4 февраля 2019. Машинный интеллект и умный информационный поиск. Зимняя школа МФТИ по искусственному интеллекту. (PDF, 3.1 МБ).
31 октября 2018. Data Science: как наладить взаимодействие науки, бизнеса и образования. Data Halloween —– конференция про возможности Data Science для бизнеса. (PDF, 1.5 МБ).
24 октября 2018. Машинное обучение для анализа текстов и сложно структурированных данных. О проектах лаборатории машинного интеллекта МФТИ. Вебинар в рамках подготовки к студенческой одимпиаде «Я профессионал». (PDF, 2.3 МБ). Видеозапись.
23 октября 2018. Тематические векторные представления текстов, графов и транзакционных данных. RAIF-2018: Russian Artificial Intelligence Forum (PDF, 3.2 МБ).
22 октября 2018. Тематические векторные представления текстов, графов и транзакционных данных. IX Московская международная конференция по Исследованию Операций (ORM-2018 Germeyer-100) (PDF, 3.4 МБ). Видеозапись.
8 октября 2018. Тематические векторные представления текстов, графов и транзакционных данных. Интеллектуализация обработки информации (конференция)/2018 (PDF, 3.7 МБ).
28 сентября 2018. Технологии машинного обучения и обработки естественного языка для LegalTech. Программа «LegalTech директор» (PDF, 2.2 МБ).
15 сентября 2018. Визуализация в информационном поиске. Первая открытая лаборатория визуального мышления. МФТИ. (PDF, 6.3 МБ).
11–12 июня 2018. Вероятностное тематическое моделирование: опыт построения прикладной теории. Традиционная Школа «Управление, информация и оптимизация». (PDF, 8.5Мб).
22 мая 2018. Области использования машинного интеллекта. Школа-семинар для молодых ученых «Основы социоинженерии». ИПУ РАН. (PDF, 2.5 МБ). Видеозапись.
18 мая 2018. The Problems, Methods and Limitations of Machine Intelligence: Mining Texts, Graphs and Hypergraphs. Cognitive Technologies and Quantum Intelligence Conference. Saint Petersburg. (PDF, 2.3 МБ).
28 апреля 2018. Наука и бизнес в одном FLACONе: возгонка цифровой экономики. DataFest-5. (PDF, 1.2 МБ). Видеозапись.
28 апреля 2018. Тематическое моделирование в BigARTM: новые возможности. DataFest-5. (PDF, 5.9 МБ). Видеозапись.
8 февраря 2018. Обработка естественного языка и понимание речи. Открытая конференция по искусственному интеллекту OpenTalks.AI-2018. (PDF, 1.1 МБ).
29 января 2018. Математические методы и прикладные задачи анализа текстов. Зимняя физико-математическая школа МФТИ «Абсолютное будущее». (PDF, 2.1 МБ).
23 января 2018. Машинное обучение в LegalTech: задачи, возможности, ограничения. Искусственный интеллект – мечта и/или кошмар юриста. Семинар Санкт-Петербургской Международной Бизнес-Ассоциации (СПИБА). (PDF, 2.0 МБ).
18 декабря 2017. Towards Interpretable Word Embeddings through Probabilistic Topic Modeling. Korean-Russian Artificial Intelligence Workshop. (PDF, 1.9 МБ).
9 ноября 2017. Fast and Modular Regularized Topic Modeling. The seminar on Intelligence, Social Media and Web (ISMW), Open Innovations Association FRUCT (Finnish-Russian University Cooperation in Telecommunications). Helsinki, Finland. (PDF, 1.5 МБ).
4 ноября 2017. Введение в машинное обучение. Школа глубокого обучения — кружок для старшеклассников, МФТИ. (PDF, 2.6 МБ). Видеозапись.
16 октября 2017. Машинное обучение: шаг в цифровую экономику. AI@MIPT — открытый семинар по искусственному интеллекту в МФТИ. (PDF, 4.4 МБ). Видеозапись.
10 октября 2017. Аддитивная регуляризация тематических моделей связного текста. Математические методы распознавания образов (конференция). (PDF, 2.0 МБ).
8 октября 2017. Анализ данных и машинный интеллект - профессии будущего. Фестиваль науки НАУКА 0+. Лекторий «Большие данные для школьников». (PDF, 2.0 МБ).
5 октября 2017. Многокритериальный тематический анализ текстовых коллекций. Коллоквиум факультета компьютерных наук НИУ ВШЭ. (PDF, 2.2 МБ). Видеозапись.
4 октября 2017. Проблема определения числа тем в тематических моделях. Методы анализа текстов (спецсеминары, К.В. Воронцов)/2017-2018 год. (PDF, 0.9 МБ)
1 октября 2017. Интервью в рамках открытого курса машинного обучения. Видеозапись.
25 сентября 2017. Искусственный интеллект и машинное обучение: практические шаги в цифровую экономику. Расширенное заседание Совета по законодательному обеспечению развития цифровой экономики при Председателе Государственной Думы Федерального Собрания Российской Федерации. (PDF, 1.6 МБ)
13 сентября 2017. Additive Regularization for Topic Modeling. Mini-Workshop: Stochastic Processes and Probabilistic Models in Machine Learning. (PDF, 1.7 МБ). Video.
26 июля 2017. Тематический анализ записей разговоров контакт-центра. (PDF, 2.1Мб). Видеозапись. Летняя школа и хакатон DeepHack.Turing, МФТИ.
26 июля 2017. Лекция 1: Методы анализа данных: машинное обучение в анализе текстов. (PDF, 2.5Мб). Видеозапись. Лекция 2: Тематический анализ текстов. (PDF, 6.3Мб). Видеозапись. Летняя школа «Автоматическая обработка текстов и анализ данных», НИУ ВШЭ.
17–18 июня 2017. Оптимизация и регуляризация вероятностных тематических моделей. Традиционная Школа «Управление, информация и оптимизация». (PDF, 1.5Мб). (PDF, 2.8Мб). Машинное обучение, искусственный интеллекти экономика будущего (PDF, 2.5Мб).
15 июня 2017. Статистические тесты для проверки однородности и воспроизводимости электрокардиосигналов. Конференция 175 лет ВНИИМ. (PDF, 2.3 МБ).
1 июня 2017. Тематический анализ текстов и технология BigARTM. Лекция в NewProLab. (PDF, 5.5 МБ).
4 мая 2017. История машинного обучения. Лекция в МФТИ. (PDF, 5.1 МБ). Видеозапись.
13 марта 2017. Технология информационного анализа электрокардиосигналов. «Гаджеты в медицине: перспективы использования, новые функции, техническое совершенствование, производство и финансирование». МГТУ имени Н.Э.Баумана. (PDF, 2.1 МБ).
17 февраля 2017. Машинное обучение, искусственный интеллект и экономика будущего. (PDF, 1.2 МБ).
17 ноября 2016. Машинное обучение и анализ данных. Научный семинар ВНИИА. (PDF, 1.4 МБ).
12 ноября 2016. Тематическое моделирование структуры расходов клиентов банка. Data Science Day. (PDF, 2.9 МБ). Видеозапись.
11 ноября 2016. Теория, алгоритмы и приложения вероятностного тематического моделирования. Математический кружок школы ФПМИ МФТИ. (PDF, 3.6 МБ). Видеозапись.
26 октября 2016. Матричные разложения в задачах семантического анализа текстов. Семинар отдела «Математическое моделирование экономических систем», ВЦ РАН, Москва. (PDF, 1.4 МБ).
13 октября 2016. Additive Regularization for Topic Modeling Mining Ethnical Discourse in Social Media ИОИ-2016. (PDF, 1.2 МБ)
10 октября 2016. Речь на открытии конференции ИОИ-2016. (PDF, 0.5 МБ).
4 октября 2016. Аддитивная регуляризация наивного байесовского классификатора. Девятая международная конференция «Управление развитием крупномасштабных систем» (MLSD’2016). ИПУ РАН, Москва. (PDF, 1.7 МБ).
30 сентября 2016. Тематическое моделирование. Научный семинар ФКН НИУ ВШЭ. (PDF, 5.8 МБ).
13 сентября 2016. Тематическое моделирование для поиска и систематизации научно-технической информации. Семинар «Информационные технологии в современной библиотеке». (PDF, 5.2 МБ).
10 сентября 2016. Тематическое моделирование на пути к разведочному информационному поиску. Data Fest #3. (PDF, 4.5 МБ). Видеозапись.
1–24 июля 2016. Проект «Медицинская диагностика по ЭКГ» и лекции по машинному обучению. Извлекаем пользу из Big Data (Проектная смена, СочиСириус, 2016).
19 мая 2016. История машинного обучения. Лекция в МФТИ. (PDF, 4.2 МБ).
1 февраля 2016. Regularization of Topiс Models for Question Answering. А 24/7 hackathon on Question Answering systems (solving The Allen AI Science Challenge). (PDF, 2.2 МБ). Video.
9 декабря 2015. Модели и методы интеллектуального анализа данных. Международная научная конференция по информатике и прикладной математике, посвященная 60-летию Вычислительного центра им. А. А. Дородницына РАН. (PDF, 1.2 МБ).
14 ноября 2015. Topic modeling as a key technology for exploratory search and social media mining. Artificial Intelligence and Natural Language & Information Extraction, Social Media and Web Search FRUCT Conference. (PDF, 6.0 МБ).
14 октября 2015. BigARTM: Open Source Library for Topic Modeling of Large Text Collections. Аналитика и управление данными в областях с интенсивным использованием данных DAMDID/RCDL. (PDF, 5.6 МБ).
7 октября 2015. Additive Regularization of Topic Models: Towards Exploratory Search and Other Multi-Criteria Applications. 2nd Yandex School of Data Analysis Conference. Machine Learning: Prospects and Applications. (PDF, 6.4 МБ).
20 сентября 2015. Регуляризация тематических моделей в библиотеке с открытым кодом BigARTM: технологическая основа разведочного информационного поиска. Математические методы распознавания образов, ММРО-17]. (PDF, 6.2 МБ).
12 сентября 2015. BigARTM: тематическое моделирование больших текстовых коллекций. Data Fest #1. (PDF, 6.5 МБ).
25 августа 2015. Regularized Matrix Factorization for Topic Modeling of Text Collections. 4th International Conference on Matrix Methods in Mathematics and Applications MMMA-2015, August 24-28, Moscow. (PDF, 6.4 МБ).
18–21 августа 2015. Теория и практика обучения машин. Летняя Школа «Комбинаторика и алгоритмы для школьников». Лекция 1. Задачи и алгоритмы классификации (Презентация, 4.4Мб, Данные конкурсного задания, 100Kб). Лекция 2. Метрические алгоритмы классификации (Презентация, 3.1Мб). Лекция 3. Линейные классификаторы и бустинг (Презентация, 0.4Мб).
19 июня 2015. Аддитивно регуляризованные тематические модели и разведочный поиск знаний в сети. Традиционная Школа «Управление, информация и оптимизация». Презентация, 6.3Мб. Видеозапись.
17 июня 2015. Обучение наивного Байеса. Традиционная Школа «Управление, информация и оптимизация». Презентация, 2.1Мб. Данные для конкурсного задания. Видеозапись.
29, 30 июня 2015. Automatic filtering of Russian scientific content using Machine Learning and Topic Modeling. International Conference on Computational Linguistics Dialogue 2015, May 27-30, Moscow. (PDF, 6.2 МБ).
14 мая 2015. Multicriteria Regularization for Probabilistic Topic Modeling of Large Text Collections. Доклад на Optimization and Applications in Control and Data Science (on the occasion of Boris Polyak's 80th birthday). (PDF, 2.4 МБ). Video.
9 апреля 2015. BigARTM: Open Source Library for Regularized Multimodal Topic Modeling of Large Collections. Доклад на AIST-2015. (PDF, 2.3 МБ).
14 марта 2015. Применение машинного обучения и вычислительной лингвистики для диагностики заболеваний по электрокардиограмме. Лекция для школьников, Малый ШАД. (PDF, 2.3Мб). Видеозапись.
15 декабря 2014. Machine Learning for Big Data: Texts, Signals, Images and Video. Российско-американский исследовательский симпозиум. При поддержке MIT и в сотрудничестве со Сколковским институтом науки и технологий, «Цифровой Октябрь», Москва, Россия. (PDF, 2.4Мб).
20 октября 2014. Статистическая проверка технологии информационного анализа электрокардиосигналов для диагностики заболеваний внутренних органов. Доклад на конференции Математическая биология и биоинформатика, Пущино. (PDF, 2.4Мб).
6 октября 2014. Многокритериальные и многомодальные вероятностные тематические модели коллекций текстовых документов. Доклад на конференции ИОИ-2014, Крит. (PDF, 2Мб).
12 сентября 2014. Задача диагностики многих заболеваний по одной электрокардиограмме. Семинар по машинному обучению ВМК МГУ. (PDF, 1.6Мб).
11 сентября 2014. Information function of the heart: Discrete and fuzzy encoding of the ECG-signal for multidisease diagnostic system. International Conference Advanced Mathematical and Computational Tools in Metrology and Testing (AMCTM 2014). (PDF, 1.4Мб).
11 сентября 2014. Вероятностное тематическое моделирование. Семинар в лаборатории ЛИНИС НИУ ВШЭ, Санкт-Петербург. (PDF, 1.5 МБ).
21–24 августа 2014. Теория и практика обучения машин. Летняя Школа «Комбинаторика и алгоритмы для школьников». Лекция 1. Задача диагностики заболеваний по электрокардиограмме (Презентация, 1.6Мб). Данные для конкурсного задания. Лекция 2. Методы классификации и регрессии (Презентация, 3Мб). Лекция 3. Комбинаторная теория переобучения (Презентация, 2Мб)
27 июня 2014. Матричные разложения и вероятностное тематическое моделирование текстовых коллекций. Традиционная Школа «Управление, информация и оптимизация». Презентация, 3.4Мб.
26 июня 2014. Методы статистического обучения и задача диагностики заболеваний по электрокардиограмме. Традиционная Школа «Управление, информация и оптимизация». Презентация, 1.8Мб. Данные для конкурсного задания.
5 июня 2014. Multi-criteria regularization for Probabilistic Latent Semantic Analysis. International Conference on Computational Linguistics Dialogue 2014, June 4-8, Bekasovo. (PDF, 4.2 МБ).
15 мая 2014. Additive Regularization for Probabilistic Topic Modeling. Advances in Optimization and Statistics. (PDF, 1.9 МБ).
19 апреля 2014. Многокритериальная регуляризация вероятностных тематических моделей коллекций текстовых документов. Семинар в НМУ. (PDF, 1.9 МБ). Видеозапись.
12 апреля 2014. Аддитивная регуляризация матричных разложений для вероятностного тематического моделирования. Конференция АИСТ-2014. (PDF, 3.6 МБ).
21 марта 2014. Вероятностные тематические модели без интегралов и распределений Дирихле. (PDF, 3.8 МБ).
25 февраля 2014. О некоторых задачах и методах интеллектуального анализа данных. В цикле лекций «Современных проблем прикладной математики» для студентов 2 курса ФУПМ МФТИ. (PDF, 3.1 МБ).
31 октября 2013. Аддитивная регуляризация вероятностных тематических моделей. Доклад на семинаре БММО-2013, ВМК МГУ. (PDF, 1.6 МБ).
7 октября 2013. Аддитивная регуляризация вероятностных тематических моделей. Доклад на конференции ММРО-16, Казань. (PDF, 1.1 МБ).
2 октября 2013. Combinatorial theory of overfitting. How Connectivity and Splitting Reduces the Local Complexity Measures of Complexity Symposium (PDF, 1.7 MБ).
27 сентября 2013. Combinatorial theory of overfitting. The Yandex School of Data Analysis conference (PDF, 1.7 MБ), Аннотация и видеозапись.
28 июня 2013. Combinatorial theory of overfitting. International Workshop on Statistical Learning IWSL (PDF, 1.5 MБ).
23 апреля 2013. Вероятностные тематические модели коллекций текстовых документов. Доклад на семинаре в ВИНИТИ РАН. (PDF, 2.0 МБ).
13 апреля 2013. Комбинаторная теория переобучения. Семинар в НМУ. (PDF, 3.5 МБ). Дополнение: Евгений Соколов. Линейные классификаторы и случайные блуждания. (PDF, 380 KБ)
26 февраля 2013. Вероятностные тематические модели коллекций текстовых документов. Просеминар кафедры ММП, Москва, МГУ. (PDF, 0.8 МБ).
26 сентября, 3 октября 2012. Четыре лекции по машинному обучению. Высшая Школа Экономики. (PDF, 2.9 МБ).
17 сентября 2012. Регуляризация, робастность и разреженность вероятностных тематических моделей. Доклад на конференции ИОИ-9. (PDF, 0.9 МБ).
24 мая 2012. Комбинаторная теория переобучения и её применения. Семинар лаборатории PreMoLab, Москва, ИППИ РАН. (PDF, 3.0 МБ).
27 февраля 2012. Комбинаторная теория переобучения и её применения. Просеминар кафедры ММП, Москва, МГУ. (PDF, 2.5 МБ).
19 октября 2011. Задачи анализа данных ДНК-микрочипов. Доклад на семинаре «Время, хаос и математические проблемы» (руководитель академик В.А.Садовничий), Москва, МГУ. (PDF, 3 МБ).
12 сентября 2011. Комбинаторная теория переобучения и поиск логических закономерностей. Доклад на конференции ММРО-15, Петрозаводск. (PDF, 1.4 МБ).
27,29 июня 2011. Recent Advances on Generalization Bounds. Tutorial. International conference PReMI-2011 Part 1 (PDF, 1.0 MБ), Part 2 (PDF, 1.5 MБ). Tight Combinatorial Generalization Bounds for Threshold Conjunction Rules (PDF, 0.6 MБ, на английском).
12 января 2011. Интеллектуальный анализ данных и объектно-ориентированное программирование. Лекция на Зимней компьютерной школе 2011, МФТИ. (PDF, 1.0 МБ).
7 ноября 2010. Generalization bounds based on the splitting and connectivity properties of a set of classifiers. International conference PRIA-10 (PDF, 1.4 MБ, на английском).
20 октября 2010. Точные комбинаторные оценки обобщающей способности онлайнового обучения. Конференция ИОИ-8 (PDF, 400 KБ).
18 октября 2010. Комбинаторный подход к выводу точных оценок вероятности переобучения. Конференция ИОИ-8 (PDF, 1.2 MБ).
22 апреля 2010. Комбинаторная теория надёжности обучения по прецедентам. Защита докторской диссертации. (PDF, 1760 КБ). Учёный совет квалифицировал работу как новое направление в теории статистического обучения.
3 марта 2010. Интеллектуальный анализ данных и распознавание образов. Теоретические и практические проблемы. Доклад на семинаре «Глобальные изменения климата» (руководители академик Г.И.Марчук, академик В.П.Дымников), Москва, ИВМ. (PDF, 828 КБ).
13 января 2010. Задачи и методы машинного обучения. Лекция на Зимней компьютерной школе 2010, МФТИ. (PDF, 1023 КБ).
22 сентября 2009. Комбинаторный подход к проблеме переобучения. Доклад на конференции ММРО-14, Суздаль. (PDF, 1106 КБ).
27 июля 2009. Методы машинного обучения, основанные на индукции правил (логические методы классификации). Доклад на семинаре Знания и онтологии ELSEWHERE, Москва, ВШЭ. (PDF, 1202 КБ).
10 ноября 2008. Методы коллаборативной фильтрации и их применение. Выступление на семинаре Б.Г.Миркина, ВШЭ. (PDF, 1.1 МБ).
17 сентября 2008. Пути повышения точности оценок обобщающей способности (комбинаторный подход). Пленарный доклад на международной конференции РОАИ-9-2008, Нижний Новгород. Презентация на английском (PDF, 846 КБ), на русском (PDF, 844 КБ), тезисы доклада на русском (PDF, 243 КБ).
17 сентября 2008. Презентация ресурса www.MachineLearning.ru в рамках международной конференции РОАИ-9-2008, Нижний Новгород. (PDF, 285 КБ, на английском).
13 июня 2008. Вики-ресурс MachineLearning.RU: концепция и перспективы, круглый стол в рамках конференции ИОИ-2008, Крым, Алушта. (PDF, 198 КБ).
12 июня 2008. Слабая вероятностная аксиоматика, оценки надёжности эмпирических предсказаний, расслоение и различность алгоритмов. Конференция ИОИ-2008, Крым, Алушта. (PDF, 950 КБ).
28 апреля 2008. О некоторых задачах интеллектуального анализа данных — одна лекция в рамках курса «Современные проблемы прикладной математики» для студентов 5 курса ВМК МГУ. (PDF, 764Кб).
28 апреля 2008. Оценки надёжности эмпирических предсказаний (комбинаторный подход). Ломоносовские чтения 2008. (PDF, 804 КБ).
30 сентября 2007. Слабая вероятностная аксиоматика и надёжность эмпирических предсказаний. Конференция ММРО-13. (PDF, 910 КБ).
20 august 2007. 7th Open German/Russian Workshop (OGRW-7) on Pattern Recognition and Image Understanding, Ettlingen, Germany. Combinatorial Approach to Generalization Bounds Tightening. (PDF, 1.9 МБ, на английском).
4 июня 2006. Прикладные исследования и разработки компании Форексис в области интеллектуального анализа данных. Конференция ИОИ-2006, Крым, Алушта. (PDF, 460 КБ)
5 ноября 2005. Измерение локальной эффективной функции роста в задачах поиска логических закономерностей. Конференция ММРО-12. (PDF, 285 КБ), вместе с речью — (PDF, 308 КБ).
14 июня 2004. Комбинаторный подход к оцениванию качества алгоритмов, обучаемых по прецедентам. Конференция ИОИ-2004, Крым, Алушта. (PDF, 520 КБ).
28 ноября 2003. Комбинаторные оценки качества обучения по прецедентам. Конференция ММРО-11. (PDF, 680 КБ).

Научные интересы

Всё, что скрывается за терминами «науки о данных» (data science), «интеллектуальный анализ данных» (data mining) и «машинное обучение» (machine learning): распознавание образов, прогнозирование, математическая статистика, дискретная математика, численные методы оптимизации, аналитика больших данных, а также практический анализ данных в разнообразных областях (медицина, техника, биоинформатика, экономика, лингвистика, интернет).

Анализ текстов и информационный поиск

Современные средства текстового поиска предназначены для ответов на короткие текстовые запросы. Этого не достаточно при самообразовании и поиске научной информации, в особенности новой или содержащей неизвестную пользователю терминологию. Поиск и мониторинг новых тенденций, терминологии, профессиональных сообществ всё ещё требует больших затрат времени и высокой квалификации. Существует барьер входа в новую профессиональную область. Ответ на вопрос «где находится передний край науки по данной теме» по-прежнему достигается, главным образом, путём личного общения, следовательно, субъективен и не общедоступен. Наш подход к исследовательскому поиску (Exploratory Search) основан на концепции Мастерской Знаний. Это среда для поиска, анализа и переработки больших объёмов текстовой информации. В ней пользователь «мастерит» тематические текстовые подборки. Мастерская помогает ему расширять подборку, писать по ней рефераты и обзоры, выделять ключевые понятия и факты, систематизировать по темам, строить графические визуализации в виде «карты знаний». Миссия проекта — убирать барьеры между человеком и знанием. В Мастерской применяются разнообразные технологии обработки естественного языка (NLP).

Вероятностное тематическое моделирование (Probabilistic Topic Modeling) служит для выявления тематики больших текстовых коллекций и определения, к каким темам относится каждый текстовый документ. Также оно находит всё больше неожиданных применений в областях, далёких от анализа текстов: при обработке изображений и видео, звуковых и биомедицинских сигналов, нуклеотидных и аминокислотных последовательностей, пользовательских логов, финансовых и транзакционных данных.

Основные направления исследований и разработок

теория и методы аддитивной регуляризации тематических моделей (ARTM);
разработка BigARTM — библиотеки с открытым кодом для тематического моделирования больших коллекций;
разработка инструментальной среды для тематического моделирования TopicNet;
разработка поисково-рекомендательной системы SciSearch.ai;
автоматическое выделения терминов-словосочетаний в текстах;
тематические модели последовательного текста, тематической структуры и сегментации текстов;
мультимодальные тематические модели, классификация и регрессия с текстовыми и разреженными признаками;
иерархические тематические модели и категоризация текстов;
методы визуализации тематических моделей;
методы автоматического именования тем;
проблемы сходимости и устойчивости численных методов матричных и тензорных разложений;
проблемы интерпретируемости тем;
мультиязычные тематические модели;
тематические модели транзакционных данных или гиперграфов;
анализ тональности и разделение тем на полярные мнения;
темпоральные (динамические) тематические модели;
автоматическое оценивание когнитивной сложности текста;

Прикладные задачи

иерархическая тематическая модель научного и научно-популярного контента;
тематический исследовательский информационный поиск;
полуавтоматическое реферирование тематических подборок научных статей;
классификация и динамическая тематизация новостных потоков;
модели символьной динамики для анализа дискретных временных рядов;
тематическая кластеризация отзывов клиентов или опросов персонала;
классификация и сценарный анализ записей разговоров контактного центра;
выявления паттернов потребительского поведения клиентов по банковским транзакциям;
выявление видов экономической деятельности компаний по банковским транзакциям;

Ключевые слова

text analysis, information retrieval, keyphrase extraction, topic modeling, probabilistic latent semantic analysis (PLSA), latent Dirichlet allocation (LDA), Gibbs sampling, documents categorization, learning to rank, research trends, research front.

Материалы и задания

Тематический анализ больших данных. Краткое популярное введение в BigARTM.
Воронцов К. В. Вероятностное тематическое моделирование: теория регуляризации ARTM и библиотека с открытым кодом BigARTM. — обновление 19.05.2023.
Разведочный информационный поиск. Видеолекция на ПостНауке.
Тематическое моделирование. FAQ на ПостНауке, совместно с Корпоративным университетом Сбербанка.
Тематическое моделирование на пути к разведочному информационному поиску. Лекция на DataFest3, 10 сентября 2016. Видеозапись.
Практическое задание, 2016.
Коллекции документов для тематического моделирования.

Фейковые новости и потенциально опасный дискурс

Постправда — это политика игнорирования фактов, использования фейковых новостей и приёмов пропаганды для формирования общественного мнения. Опасность постправды в том, что она навязывает социуму ложную картину мира и вынуждает людей принимать невыгодные для них решения. Блогосфера и социальные сети способствуют распространению фейков, лженаучных и мифологизированных представлений о мире. Средства массовой информации всё чаще используются для ведения информационных войн между корпорациями, государствами и идеологиями. Создание технологий, способных противостоять некритичному восприятию постправды, становится фундаментально важной задачей. Речь идёт об использовании технологий машинного обучения и автоматической обработки текстов для выявления манипулятивных приёмов, обмана, слухов, сплетен, мистификаций, противоречий, замалчивания, мифологизации и идеологизации. Мы называем эти явления потенциально опасным дискурсом. Их необходимо не только выявлять, но и оценивать степень их опасности, и на какие целевые аудитории направлено воздействие. Исследование носит междисциплинарный характер и предполагает тесное взаимодействие с лингвистами, журналистами, политологами, психологами.

Основные направления исследований и разработок:

распознавание фейков в новостях;
распознавание пропаганды и приёмов информационной войны;
поиск противоречивых оценок и интерпретаций одних и тех же событий в различных источниках;
выявление манипулятивных приёмов в тексте;
классификация психоэмоциональных реакций целевых аудиторий на текстовое сообщение;
выявление конструктов мифологизированной/идеологизированной картины мира (мифологем/идеологем);
модели классификации текстов, пар текстов и фрагментов текстов по размеченным выборкам;
методы активного обучения для формирования неразмеченных выборок в краудсорсинге;
разработка открытых библиотек для выявления и анализа потенциально опасного дискурса.

Материалы

Отслеживание контактов и оценка рисков инфицирования

В условиях пандемии перед производственными предприятиями и организациями встают вопросы: какие противоэпидемиологические мероприятия провести, чтобы минимизировать потери, избежать локдауна или максимально эффективно из него выйти. Кого в первую очередь тестировать, кого отправлять на карантин, кого вакцинировать, для всех ли сотрудников масочно-перчаточный режим строго обязателен. Ответы на эти вопросы не универсальны и зависят от структуры контактов на конкретном предприятии. В проекте используются данные о контактах, предоставленные компанией Софттри в рамках проекта Amuleit, для моделирования распространения инфекции по графу контактов и сравнения эффективности различных мероприятий. Для оценивания индивидуального риска инфицирования строятся вероятностные модели по обучающим выборкам, сформированным имитационной моделью распространения инфекции по графу контактов. Оценки индивидуального риска позволяют формировать приоритетные списки людей для тестирования и вакцинации, и тем самым существенно сокращать затраты и повышать эффективность противоэпидемических мероприятий.

Основные направления исследований и разработок:

имитационное моделирование распространения инфекции по заданному динамическому графу контактов;
имитационное моделирование для генерирования динамического графа контактов;
вероятностные модели риска с прямым и обратным отслеживанием контактов;
методы инкрементного обучения вероятностной модели индивидуального риска инфицирования;
оценивание результативности противоэпидемиологических мероприятий с помощью имитационного моделирования.

Материалы

Обучаемые модели распространения риска на графе.

Теория обобщающей способности

Проблема обобщающей способности является ключевой и в то же время наиболее сложной в машинном обучении. Её даже выделяют в отдельную дисциплину — теорию вычислительного обучения. Если алгоритм, восстанавливающий некоторую неизвестную зависимость, построен по конечной обучающей выборке прецедентов, то как предсказать качество его работы на контрольной выборке, состоящей из новых прецедентов? Почему это вообще возможно? Как надо обучать алгоритм, чтобы он редко ошибался на новых данных?

Активное исследование этих вопросов началось в конце 60-х, когда В.Н.Вапник и А.Я.Червоненкис предложили статистическую теорию восстановления зависимостей по эмпирическим данным (VC theory) и получили верхние оценки вероятности ошибки обученного алгоритма (VC-bounds). Эти оценки позволили обосновать давно замеченный эмпирический факт: по мере увеличения сложности используемого семейства алгоритмов качество обучения сначала улучшается, затем начинает ухудшаться. Ухудшение связано с эффектом переобучения. Если алгоритм имеет избыточное число параметров («степеней свободы»), то он может слишком точно настроиться на конкретную обучающую выборку в ущерб качеству восстановления зависимости в целом. В теории Вапника-Червоненкиса разработан метод структурной минимизации риска (СМР), позволяющий автоматически находить модель оптимальной сложности. К сожалению, оценки вероятности ошибки чрезвычайно завышены (осторожны, пессимистичны), что может приводить к переупрощению модели в методе СМР. Несмотря на 40-летние усилия многих ученых и существенное усложнение математического аппарата, точные оценки до сих пор не были получены.

Комбинаторная теория переобучения — это принципиально новый подход, основанный на слабой вероятностной аксиоматике, впервые позволивший получить точные (не завышенные, не асимптотические) комбинаторные оценки вероятности переобучения и показать ключевую роль эффектов расслоения и сходства в семействах алгоритмов. Пока что точные оценки получены лишь для ряда модельных семейств алгоритмов, обладающих некоторой регулярной структурой. Для реальных смейств удалось получить верхние оценки расслоения-связности — SC-оценки (splitting and connectivity bounds). Они завышены в разы, тогда как VC-оценки завышены на 5–8 порядков. Для некоторых модельных семейств SC-оценки являются точными. Тем не менее, проблемы остаются, и дело не только в завышенности оценок. Во-первых, SC-оценки могут быть ненаблюдаемыми, то есть в них могут входить некоторые функции от скрытых контрольных данных. Эти функции вполне можно оценивать по наблюдаемым обучающим данным, но это дополнительная работа. Во-вторых, SC-оценки могут быть вычислительно неэффективными и требовать неадекватно больших затрат памяти и времени. Получение приближённых или асимптотических SC-оценок гарантированной точности также является отдельной работой.

Пока имеется лишь два примера практического применения комбинаторных оценок обобщающей способности:

Модификация критериев информативности для уменьшения переобучения конъюнктивных закономерностей в логических алгоритмах классификации (Андрей Ивахненко).
Эффективный алгоритм отбора эталонных объектов в методе ближайших соседей (Максим Иванов).

Основная цель дальнейших исследований — доведение комбинаторной теории переобучения до уровня практической применимости.

Основные направления исследований:

разработка математической техники для перехода от ненаблюдаемых оценок к наблюдаемым (возможно, как на основе комбинаторики, так и на основе теории концентрации вероятностной меры);
исследование комбинаторно-статистических свойств графа расслоения-связности модельных и реальных семейств алгоритмов.
получение оценок вероятности переобучения через наблюдаемый профиль расслоения-связности;
разработка эффективных методов оценивания нижних слоёв профиля расслоения-связности в конкретных методах обучения;
разработка логических алгоритмов классификации с управляемой переобученностью логических закономерностей;
развитие понятия «плотности» семейства алгоритмов и изучение возможности аппроксимации «плотных» семейств их «разреженными» подсемействами малой мощности;
развитие понятия «комбинаторного отступа» и его использование для повышения обобщающей способности линейных классификаторов;
развитие понятия локальной радемахеровской сложности для более аккуратного учёта эффектов расслоения и сходства;
обобщение понятий расслоения и сходства алгоритмов для непрерывных функций потерь;
разработка эффективных метрических алгоритмов классификации на основе комбинаторных оценок полного скользящего контроля;
исследование связи профилей компактности с функциями конкурентного сходства;
разработка методики тестирования и анализа обобщающей способности для «Полигона алгоритмов классификации».

Материалы:

Воронцов К. В. Теория надёжности обучения по прецедентам. Курс лекций ВМК МГУ и МФТИ. 2011.
Воронцов, К. В. Комбинаторная теория надёжности обучения по прецедентам: Дис. док. физ.-мат. наук: 05-13-17. — Вычислительный центр РАН, 2010. — 271 с. (подробнее)
Комбинаторная теория переобучения (виртуальный семинар)

Ключевые слова: overfitting, generalization bounds, computational learning theory, Vapnik-Chervonenkis theory, local Rademacher complexity.

Комбинаторная (перестановочная) статистика

Это направление логично вытекает из предыдущего и является его обобщением. Оказывается, многие фундаментальные факты теории вероятностей и математической статистики можно переформулировать и доказать, не опираясь на колмогоровскую аксиоматику, то есть не используя теорию меры, и даже не употребляя само понятие вероятности. В задачах анализа данных мы всегда имеем дело с выборками конечной длины. Поэтому естественно ставить вопрос не «какова вероятность события?», а «какой может быть частота этого события на скрытых (пока еще не известных) данных?». Ответы на эти два вопроса, вообще говоря, различны, причем на выборках малой длины различие существенно. Вероятность события — абстрактная идеализированная величина. Частота события — это как раз то, что реально измеряется в эксперименте. Именно её и имеет смысл оценивать (предсказывать).

Слабая вероятностная аксиоматика основана на одной единственной аксиоме: рассматривается конечная выборка неслучайных объектов, которые появляются в случайном порядке, причём все перестановки равновероятны. Событие — это бинарная функция на множестве всех перестановок выборки. Вероятность события определяется как доля перестановок выборки, при которых эта бинарная функция принимает единичное значение (т.е. событие имеет место).

В слабой аксиоматике удаётся переформулировать значительную часть фундаментальных результатов теории вероятностей и математической статистики, оносящихся к конечным выборкам независимых наблюдений. В их числе: закон больших чисел, закон сходимости эмпирических распределений (критерий Смирнова), многие непараметрические, ранговые и перестановочные статические критерии, теория обобщающей способности, теория информации. Во многих случаях получаемые оценки являются точными, т.е. не асимптотическими и не завышенными. Многие результаты сильно упрощаются, освобождаясь от второстепенных технических усложнений, связанных с теорией меры. Например, отпадает необходимость введения различных типов сходимости.

Основные направления исследований:

выяснение границ применимости слабой вероятностной аксиоматики;
точные (комбинаторные) статистические тесты;
эффективные алгоритмы вычисления комбинаторных оценок;
исследование других вероятностных предположений, кроме равновероятности всех перестановок;
множественное тестирование статистических гипотез и его связь с проблемой переобучения.

Ключевые слова: exchangeability, permutational statistics, concentration of probability measure.

Прогнозирование объёмов продаж

Задачи прогнозирования объёмов продаж в сетях супермаркетов характеризуются огромным количеством временных рядов, фактической невозможностью использования классических ресурсоёмких методов прогнозирования, несимметричностью функции потерь, разнородностью и нестационарностью временных рядов, наличием пропусков и неточностей в данных, возможностью привлечения дополнительной информации о структуре ассортимента, географии продаж, ценах, промо-акциях и поведении конкурентов.

Основные направления исследований:

адаптивные методы краткосрочного прогнозирования при несимметричной функции потерь;
адаптивные композиции алгоритмов прогнозирования при несимметричной функции потерь;
адаптивные методы прогнозирования плотности распределения;
адаптивные методы квантильной регрессии;
поиск взаимозаменяемых товаров, анализ и прогнозирование каннибализации брендов.

Материалы:

Видеолекция на ПостНауке: Математические методы прогнозирования объемов продаж.

Ключевые слова: sales forecast, density forecast, forecasting under asymmetric loss, quantile regression.

Другие проекты и семинары

(в значительной степени устаревшие)

Виртуальные семинары

Материалы для преподавателей

Семинары

Методы анализа текстов (спецсеминары, К.В. Воронцов)/2017-2018 год
Задачи анализа данных в бизнес-аналитике (семинар К. В. Воронцова)
Семинар К. В. Рудакова — регулярный не виртуальный семинар (следите за объявлениями!)

Публикации

Основное

LaTeX2e в примерах. — 2005. — 56 c.
Теория обучения машин. Первый семестр. Курс лекций ВМК МГУ и МФТИ.
Теория надёжности обучения по прецедентам. 2011. Курс лекций ВМК МГУ и МФТИ.
Вероятностное тематическое моделирование: теория регуляризации ARTM и библиотека с открытым кодом BigARTM. 2023.

Всё остальное

Полный список публикаций.
Publications of Konstantin Vorontsov in English — список публикаций на английском языке.

Софт и проекты

ChartLib — Библиотека деловой и научной графики (1998-2008)

Удобный инструмент для аналитических исследований, генерации графиков в Internet, подготовки отчетов, выполнения курсовых и дипломных работ, встраивания графиков в приложения на Delphi и C#. Имеет собственный формат входных данных CHD (CHart Description), позволяющий описывать как таблицы данных, так и внешний вид графика. Поддерживается более 150 команд, более 50 свойств точек графика, имеется встроенный калькулятор арифметических выражений. Графики могут быть выведены в окно прикладной программы, на принтер, в буфер обмена, в файлы графических форматов BMP, EMF, PNG, JPEG, GIF. Имеется программа chdView.exe для просмотра CHD-файлов.

Страница: ChartLib

Документация: на сайте ВЦ РАН (надо вручную переключиться на KOI8-R)

BigARTM — Открытая библиотека тематического моделирования (текущий проект)

Параллельная распределённая реализация методов вероятностного тематического моделирования на основе аддитивной регуляризации. Реализация ядра библиотеки на С++, интерфейсы на C++, Python. Позволяет добавлять новые регуляризаторы и метрики качества.

Страница: github.com/bigartm

Документация: bigartm.org

Архитектор проекта Александр Фрей

TopicNet — Открытая библиотека тематического моделирования под Python (текущий проект)

Верхнеуровневая обёртка над BigARTM, упрощающая построение тематических моделей в прикладных проектах и автоматизирующая проведение вычислительных экспериментов по оптимизации моделей.

Страница: github.com/machine-intelligence-laboratory/TopicNet

Разработка лаборатории машинного интеллекта МФТИ

SciSearch.ai — пилотный проект «Мастерской знаний» (текущий проект)

Поисково-рекомендательная система для формирования и анализа тематических подборок англоязычных научных статей.

Аспиранты и студенты

Аспиранты

МФТИ

МГУ

Илья Жариков

Юлиан Сердюк

Василий Алексеев
Полина Потапова
Олег Сомов
Николай Герасименко
Кирилл Хрыльченко

Дарья Соболева
Николай Скачков

Светлана Крыжановская
Алексей Гришанов

Виктор Панкратов

Иван Лукьяненко
Георгий Жаров

Арсений Веселов

Анна Балакова
Евгений Косарев
Сергей Артамонов

Воробьев Сергей
Дзюба Мария
Морозов Ярослав

Авдеев Роман
Мелихов Дмитрий
Панин Никита
Черникова Полина

Бакалаврские диссертации

Дмитрий Иванцов. Новые методы технического анализа фьючерсных рынков. 2003. МФТИ.
Рустем Таханов. Некоторые комбинаторные оценки качества обучения по прецедентам. 2004. МФТИ.
Дмитрий Житлухин. О некоторых алгоритмах синтеза неэквивалентных матриц Адамара. 2005. МФТИ.
Андрей Ивахненко. Исследование обобщающей способности логических алгоритмов классификации. 2005. МФТИ.
Василий Лексин. Методы выявления взаимосогласованных структур сходства в системах взаимодействующих объектов. 2005. МФТИ.
Фёдор Ульянов. Связь информативности и обобщающей способности в метрических алгоритмах классификации. 2005. МФТИ.
Сергей Ументаев. Алгоритмы динамического обучения принятию решений в сильно зашумлённых временных рядах. 2005. МФТИ.
Иван Гуз. Алгоритмические композиции с монотонными и выпуклыми корректирующими операциями. 2006. МФТИ.
Александр Маценов. Методы обучения линейных композиций алгоритмов классификации. 2006. МФТИ.
Никита Пустовойтов. Обучение композиций дипольных классификаторов на основе ЕМ-алгоритма. 2007. МФТИ.
Александр Климов. Методы предсказания рейтингов в рекомендующих системах. 2007. МФТИ.
Александр Орлов. Проблема переобучения при отборе признаков в линейной регрессии с фиксированными коэффициентами. 2007. МФТИ.
Артур Коваль. Прогнозирование временных рядов с несимметричным функционалом потерь. 2007. МФТИ.
Александр Ширяев. Выбор опорных множеств в алгоритмах типа вычисления оценок: нейросетевой подход. 2007. ВМК МГУ.
Ирина Лебедева. Об одном методе статистически обоснованного сравнения временных рядов доходности паевых инвестиционных фондов. 2008. МФТИ.
Александр Фрей. О дискретных аппроксимациях непрерывных вероятностных распределений. 2008. МФТИ.
Кирилл Чувилин. Проблема переобучения при отборе признаков по внешним критериям в многомерной линейной регрессии. 2008. МФТИ.
Пётр Цюрмасто. Влияние различности алгоритмов на обобщающую способность метода минимизации эмпирического риска. 2008. МФТИ.
Андрей Бадзян. Комбинаторный аналог неравенства МакДиармида и обобщающая способность стабильных алгоритмов. 2008. МФТИ.
Анастасия Зухба. Метрические алгоритмы классификации с отбором опорных объектов. 2009. МФТИ.
Павел Минаев. Расширенная методика тестирования алгоритмов классификации. 2009. МФТИ.
Алексей Романенко. Адаптивный выбор оптимальной модели временного ряда на основе множества статистических критериев. 2009. МФТИ.
Алексей Куренной. Распознавание цитат в текстовых фрагментах. 2009. ВМК МГУ.
Никита Спирин. Монотонные композиции алгоритмов ранжирования. 2010. МФТИ.
Юрий Янович. Оценивание скрытого профиля компактности в задачах обучения методом ближайшего соседа. 2010. МФТИ.
Алексей Островский. Эмпирическое исследование линейных и монотонных композиций алгоритмов ранжирования. 2010. МФТИ.
Игорь Литвинов. Адаптивные методы квантильной регрессии для прогнозирования временных рядов. 2010. МФТИ.
Евгений Зайцев. Прогнозирование средних скоростей движения в городской автотранспортной сети. 2011. МФТИ.
Никита Животовский. Вероятность большого отклонения частоты ошибок на тестовой выборке от оценки скользящего контроля. 2011. МФТИ.
Александр Мафусалов. Комбинаторные оценки вероятности переобучения пороговых классификаторов. 2011. МФТИ.
Александр Фирстенко. Методы выделения терминов и тематической классификации текстовых документов. 2011. МФТИ.
Михаил Кокшаров. Комбинаторные оценки обобщающей способности на основе попарного сравнения алгоритмов. 2012. МФТИ.
Михаил Бурмистров. Методы оптимизации параметров вероятностных тематических моделей. 2012. МФТИ.
Александр Романенко. Категоризация текстов на основе монотонного классификатора ближайшего соседа. 2012. МФТИ.
Илья Ямщиков. Методы обучаемого ранжирования для поиска релевантных алгоритмов классификации. 2012. МФТИ.
Ильдар Газизов. Проект информационно-аналитической системы для поддержки консультирования по функционально-ролевой модели бизнеса. 2012. МФТИ.
Степан Лобастов. Построение тематической классификации коллекции документов с неизвестным числом тем, презентация. 2013. МФТИ.
Влада Целых. Статистические критерии адекватности вероятностных тематических моделей коллекции текстовых документов, презентация. 2013. МФТИ.
Светлана Цыганова. Выявление несогласованностей в иерархической тематической модели с фиксированной иерархией. 2013. МФТИ.
Александр Бырдин. Классификация текстовых объявлений. 2014. МФТИ.
Сергей Воронов. Фильтрация и тематическое моделирование коллекции научных документов. 2014. МФТИ.
Олег Гринчук. Классификация нестационарного потока текстовых объявлений, презентация. 2014. МФТИ.
Кирилл Неклюдов. Обнаружение аномалий в дискретных временных рядах, презентация. 2014. МФТИ.
Мария Рыскина. Регуляризация вероятностных тематических моделей для повышения устойчивости и интерпретируемости. 2014. МФТИ.
Даниил Яшков. Методы понижения размерности в задаче поиска аномалий в многомерных временных рядах, презентация. 2014. МФТИ.
Андрей Шапулин. Регуляризация вероятностных тематических моделей для классификации символьных последовательностей. 2015. ВМК МГУ.
Михаил Хальман. Методы персонализации показа объявлений в рекламной сети. 2015. ВМК МГУ.
Никита Дойков. Адаптивная регуляризация вероятностных тематических моделей. 2015. ВМК МГУ.
Мурат Апишев. Мультимодальные регуляризованные вероятностные тематические модели. 2015. ВМК МГУ.
Александра Кузнецова. Методы регуляризации для отбора признаков в линейных классификаторах и их применение в банковской клиентской аналитике. 2015. ВШЭ.
Алексей Гринчук. Использование контекстной документной кластеризации для улучшения качества тематических моделей. 2015. МФТИ.
Ирина Ефимова. Формирование однородных обучающих выборок в задачах классификации. 2015. МФТИ.
Андрей Игнатов. Deep Learning in information analysis of electrocardiogram signals for disease diagnostics. 2015. МФТИ.
Анна Липатова. Выделение мультиграммных признаков в задачах классификации символьных последовательностей. 2015. МФТИ.
Анастасия Макарова. Выделение информативных признаков заболеваний в информационном анализе электрокардиосигналов. 2015. МФТИ.
Александр Плавин. Отбор тем в задачах тематического моделирования. 2015. МФТИ.
Михаил Швец. Монотонные классификаторы для задач медицинской диагностики. 2015. МФТИ.
Михаил Шинкевич. Применение коллаборативной фильтрации, активного обучения и навигационной корреляции в задаче выделения селекторов. 2015. МФТИ.
Надежда Чиркова. Иерархические тематические модели для интерактивной навигации по коллекциям текстовых документов. 2016. ВМК МГУ.
Никита Шаповалов. Тематические модели для классификации символьных последовательностей в задачах биоинформатики и анализа биомедицинских сигналов. 2016. ВМК МГУ.
Юлия Молчанова. Проверка адекватности тематических моделей в онлайновых алгоритмах. 2016. ВМК МГУ.
Иван Ивашковский. Методы инициализации в вероятностном тематическом моделировании. 2016. ФИВТ МФТИ.
Анастасия Янина. Мультимодальные тематические модели статей коллективных блогов для разведочного поиска. 2016. ФИВТ МФТИ.
Илья Жариков. Статистические тесты однородности символьных последовательностей. 2016. ФУПМ МФТИ.
Евгений Смирнов. Суммаризация тем в вероятностном тематическом моделировании. 2016. ФУПМ МФТИ.
Светлана Шишковец. Аддитивная регуляризация наивного линейного байесовского классификатора. 2016. ФУПМ МФТИ.
Роза Айсина. Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным. 2017. ВМК МГУ.
Артём Попов. Регуляризация тематических моделей для векторных представлений слов. 2017. ВМК МГУ.
Владимир Полушин. Тематические модели для ранжирования рекомендаций текстового контента. 2017. ВМК МГУ.
Владислав Батаев. Тематическая сегментация разговоров контактного центра. 2017. ФИВТ МФТИ.
Карен Манукян. Интеллектуальная диалоговая система для автоматизации деятельности контакт-центра. 2017. ФИВТ МФТИ.
Александр Софиенко. Классификация положительных и неразмеченных текстовых документов. 2017. ФИВТ МФТИ.
Дмитрий Федоряка. Технология интерактивной визуализации тематических моделей. 2017. ФУПМ МФТИ.
Ольга Цветкова. Анализ банковских транзакционных данных для выявления паттернов экономического поведения клиентов. 2017. ФУПМ МФТИ.
Виталий Малыгин. Формирование репрезентативных обучающих выборок. 2017. ФУПМ МФТИ.
Дарья Соболева. Языковое моделирование в задаче построения вопрос-ответной системы. 2018. ВМК МГУ.
Николай Кругликов. Тематическое моделирование текстовых коллекций в диалоговых системах. 2018. ВМК МГУ.
Анастасия Фадеева. Темпоральное моделирование новостных потоков. 2018. ФКН НИУ ВШЭ.
Мария Селезнёва. Построение и оценка качества гетерогенных иерархических тематических моделей. 2018. ФУПМ МФТИ.
Василий Алексеев. Внутритекстовая когерентность как мера интерпретируемости тематических моделей текстовых коллекций. 2018. ФУПМ МФТИ.
Антон Захаренков. Итеративный подбор коэффициентов регуляризации тематических моделей. 2018. ФУПМ МФТИ.
Даниил Фельдман. Использование фактов для поиска мнений в новостях. 2018. ФУПМ МФТИ.
Филипп Никитин. Применение мультимодальных тематических моделей к анализу транзакционных данных. 2018. ФУПМ МФТИ.
Анастасия Павловская. Тематическое моделирование в задаче классификации отзывов покупателей о работе и ассортименте продуктового магазина. 2018. ФУПМ МФТИ.
Николай Скачков. Тематико-стилистические векторные представления текстовых пользовательских запросов. 2019. ВМК МГУ.
Михаил Солоткий. Вероятностные тематические модели на основе данных о со-встречаемости слов. 2019. ВМК МГУ.
Галина Фоминская. Проблема несбалансированности тем в вероятностных тематических моделях. 2019. ВМК МГУ.
Николай Шаталов. Методы обучения без учителя для автоматического выделения составных терминов в текстовых коллекциях. 2019. ВМК МГУ.
Вадим Захаренко. Методы обнаружения новых тем в вероятностных тематических моделях. 2019. ВМК МГУ.
Анастасия Кряжова. Методы оценивания семантической близости фраз для классификации текстовых сообщений. 2019. НИУ ВШЭ.
Анна Рогозина. Проверка гипотезы условной независимости для оценивания качества тематической кластеризации. 2019. ФПМИ МФТИ.
Евгений Козлинский. Сегментация транзакционных данных розничных клиентов банка. 2019. ФПМИ МФТИ.
Вадим Кислинский. Построение мультимодальной рекомендательной системы. 2019. ФПМИ МФТИ.
Павел Плюснин. Итерационные методы балансировки тем в тематическом моделировании. 2019. ФПМИ МФТИ.
Максим Еремеев. Ранжирование текстовых документов на основе оценок когнитивной сложности текстов. 2020. ВМК МГУ.
Алексей Гришанов. Построение рекомендательной системы, основанной на обучении с подкреплением. 2020. ФПМИ МФТИ.
Вадим Новоселов. Темпоральные тематические модели новостных потоков с возможностью обнаружения новых тем и событий. 2021. ВМК МГУ.
Виктор Панкратов. Вероятностное тематическое моделирование несбалансированных текстовых коллекций. 2021. ФПМИ МФТИ.
Анна Балакова. Выявление поляризации мнений в новостных текстах методами обучения без учителя. 2022. ВМК МГУ.
Василий Висков. Методы обучения без учителя для выделения поляризаций в новостных потоках. 2022. ВМК МГУ.
Евгений Косарев. Нейросетевые модели языка для выявления речевых манипуляций в новостных потоках. 2022. ВМК МГУ.
Сергей Воробьёв. Модели выявления манипуляций и их мишеней в новостных сообщениях. 2023. ВМК МГУ.
Мария Дзюба. Нейросетевые модели языка для ранжирования фраз в полуавтоматической суммаризации научных статей. 2023. ВМК МГУ.
Ярослав Морозов. Выделение трендов в коллекциях научных статей. 2023. ВМК МГУ.
Георгий Жаров. Поиск связи фрагментов манипуляций с именованными сущностями в текстах. 2023. ФПМИ МФТИ.
Иван Лукьяненко. Выявление манипуляций в новостях. 2023. ФПМИ МФТИ.

Магистерские диссертации

Юрий Карпов. Имитационная модель торгов. 2003. МФТИ.
Дмитрий Иванцов. Применение алгоритмов бустинга для построения комбинированных инвестиционных стратегий. 2005. МФТИ.
Денис Кочедыков. Разработка, реализация и тестирование специализированной библиотеки логических алгоритмов классификации. 2005. ВМК МГУ.
Александр Кругов. Поиск закономерностей и принятие решений по дискретным временным рядам. 2006. МФТИ.
Дмитрий Житлухин. Персонализированная рубрикация текстовых сообщений. 2007. МФТИ.
Андрей Ивахненко. Методы улучшения обобщающей способности логических алгоритмов классификации. 2007. МФТИ.
Василий Лексин. Технология персонализации на основе выявления тематических профилей пользователей и ресурсов Интернет. 2007. МФТИ.
Фёдор Ульянов. Оценивание обобщающей способности функций близости при оптимизации модели АВО. 2007. МФТИ.
Сергей Ументаев. Проблема переобучения при отборе признаков в линейной регрессии с фиксированными коэффициентами. 2007. МФТИ.
Иван Гуз. Проблема обобщающей способности и оптимизация профиля монотонности в композициях классификаторов. 2008. МФТИ.
Александр Маценов. Профиль разделимости и обобщающая способность линейных композиций классификаторов. 2008. МФТИ.
Геннадий Федонин. Композиции алгоритмов предсказания рейтингов в системах рекомендаций. 2008. МФТИ.
Никита Пустовойтов. Поиск схожих пользователей социальных сетей методами коллаборативной фильтрации. 2009. МФТИ.
Александр Орлов. Комбинаторные оценки вероятности переобучения для случая произвольной заданной матрицы ошибок. 2009. МФТИ.
Артур Коваль. Построение адаптивных композиций алгоритмов прогнозирования при несимметричной функции потерь. 2009. МФТИ.
Ирина Лебедева. Методы повышения обобщающей способности логических алгоритмов классификации. 2010. МФТИ.
Александр Фрей. Точные оценки вероятности переобучения для рандомизированного метода минимизации эмпирического риска. 2010. МФТИ.
Кирилл Чувилин. Проект интеллектуальной системы для автоматизации коррекции документов в формате LaTeX. 2010. МФТИ.
Пётр Цюрмасто. Точные комбинаторные оценки вероятности переобучения для цепочек алгоритмов. 2010. МФТИ.
Анастасия Зухба. Вычислительная сложность задачи отбора опорных объектов в методе ближайших соседей. 2011. МФТИ.
Павел Минаев. Методика тестирования алгоритмов классификации в системе Полигон и её обоснования. 2011. МФТИ.
Алексей Романенко. Методы агрегирования адаптивных алгоритмов прогнозирования. 2011. МФТИ.
Игорь Литвинов. Методы уточнения карты дорог по данным GPS-сигналов автомобилей. 2012. МФТИ.
Никита Спирин. Структурированный поиск с числовыми и логическими ограничениями в неструктурированных Веб-коллекциях. 2012. МФТИ.
Никита Животовский. Концентрация меры в комбинаторных оценках обобщающей способности. 2013. МФТИ.
Виталий Глушаченков. Устойчивость матричных разложений в задачах тематического моделирования. 2013. МФТИ.
Александр Мафусалов. Оценивание вероятности успеха в серии испытаний Бернулли по другой серии при наличии зависимости между вероятностями успеха. 2013. МФТИ.
Николай Савинов. Классификация эмоциональной окраски сообщений в социальных сетях. 2013. МФТИ.
Андрей Романов. Методы упрощения композиций, получаемых при градиентном бустинге. 2013. МФТИ.
Александр Романенко. Применение условных случайных полей в задачах обработки текстов на естественном языке. 2014. МФТИ.
Илья Ямщиков. Математические методы диагностики ишемической болезни по электрокардиограмме сверхвысокого разрешения. 2014. МФТИ.
Влада Целых. Статистические обоснования информационного анализа электрокардиосигналов для диагностики заболеваний внутренних органов. 2015. МФТИ.
Светлана Цыганова. Применение тематической модели классификации в информационном анализе электрокардиосигналов. 2015. МФТИ.
Василий Бунаков. Методы нечеткого кодирования в информационном анализе электрокардиосигналов. 2015. МФТИ.
Сергей Стенин. Мультиграммные аддитивно регуляризованные тематические модели. 2015. МФТИ
Дмитрий Аникушин. Использование вероятностных тематических моделей для персонализации показов рекламы. 2015. ФИВТ МФТИ.
Дмитрий Гронский. Аддитивная регуляризация тематических моделей для задачи классификации символьных последовательностей. 2015. ФИВТ МФТИ.
Кирилл Остапенко. Выявление случаев мошенничества в онлайн-играх методами машинного обучения. 2015. ФИВТ МФТИ.
Виктор Булатов. Использование графовой структуры в тематическом моделировании. 2016. ФИВТ МФТИ.
Илья Ирхин. Сходимость численных методов вероятностного тематического моделирования. 2016. ФИВТ МФТИ.
Анжелика Сухарева. Оценивание качества выделения терминов в задаче классификации текстовых документов. 2016. ФУПМ МФТИ.
Евгения Вдовина. Отбор признаков для многоклассовой классификации символьных последовательностей. 2016. ФУПМ МФТИ.
Мурат Апишев. Параллельная реализация аддитивно регуляризованного тематического моделирования и её применение для поиска этно-релевантного контента в социальных медиа. 2017. ВМК МГУ.
Юлия Лукашкина. Оценивание устойчивости и полноты тематических моделей мультидисциплинарных текстовых коллекций. 2017. ВМК МГУ.
Андрей Шапулин. Классификация тем в вероятностных тематических моделях коллекций текстовых документов. 2017. ВМК МГУ.
Илья Голубев. Аддитивная регуляризация тематических моделей для выделения полных наборов тем в коллекциях текстовых документов. 2017. ФКН НИУ ВШЭ.
Роман Дербаносов. Проблемы устойчивости и единственности стохастического матричного разложения. 2017. ФКН НИУ ВШЭ.
Илья Удалов. Библиотека с открытым исходным кодом для оптимизации и регуляризации линейных предсказательных моделей по большим выборкам данных. 2017. ФКН НИУ ВШЭ.
Ирина Ефимова. Иерархическая мультимодальная тематическая модель коллекции научно-популярных текстов. 2017. ФУПМ МФТИ.
Андрей Игнатов. Улучшение качества цифровых снимков с помощью глубоких свёрточных нейронных сетей. 2017. ФУПМ МФТИ.
Макар Краснопёров. Выделение именованных сущностей на основе текстов высокой похожести. 2017. ФИВТ МФТИ.
Александр Кузьмин. Адаптивный выбор траектории регуляризации. 2017. ФИВТ МФТИ.
Руслан Камалов. Нейросетевой подход к построению тематических моделей. 2018. ВМК МГУ.
Николай Попов. Гиперграфовые тематические модели транзакционных данных. 2018. ВМК МГУ.
Таснима Садекова. Выделение мнений в тематических моделях новостных потоков. 2018. ВМК МГУ.
Никита Шаповалов. Интерпретируемые тематические модели новостных потоков для прогнозирования на финансовых рынках. 2018. ВМК МГУ.
Анастасия Янина. Тематический разведочный информационный поиск. 2018. ФИВТ МФТИ.
Илья Жариков. Многомодальные тематические модели на гиперграфах. 2018. ФУПМ МФТИ.
Евгений Смирнов. Тематическая сегментация диалогов контактного центра. 2018. ФУПМ МФТИ.
Роман Кулага. Классификация потока финансовых новостей с целью выявления динамики цен биржевых инструментов. 2018. ФУПМ МФТИ.
Артём Попов. Выделение множества тематик в неразмеченной коллекции диалогов. 2019. ВМК МГУ.
Вера Шишкина. Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным. 2019. ФУПМ МФТИ.
Дарина Дементьева. Агрегация и персонализация новостного текстового контента. 2019. ФУПМ МФТИ.
Пётр Остроухов. Предобученные по Википедии тематические векторные представления слов. 2019. ФУПМ МФТИ.
Александр Никитин. Иерархические тематические векторные представления слов в коллекциях текстов. 2019. НИУ ВШЭ.
Виктория Ходырева. Автоматическое именование тем в вероятностном тематическом моделировании. 2019. ФКН НИУ ВШЭ.
Василий Алексеев. Поиск полного набора тем с помощью обучения нескольких тематических моделей. 2020. ФУПМ МФТИ.
Полина Потапова. Тематическое моделирование образовательных целей пользователей в системе дистанционного образования. 2020. ФУПМ МФТИ.
Даниил Фельдман. Комбинирование фактов, семантических ролей и тональных слов в генеративной модели для поиска мнений. 2020. ФУПМ МФТИ.
Андрей Власов. Методы полуавтоматической суммаризации подборок научных статей. 2020. ФУПМ МФТИ.
Анастасия Павловская. Решение проблемы холодного старта при построении индивидуальной образовательной траектории с помощью тематического моделирования. 2020. ФИВТ МФТИ.
Олег Сомов. Проектирование и разработка вопросно-ответной системы на основе графов знаний. 2020. ФИВТ МФТИ.
Кирилл Хрыльченко. Обобщенные модальности в вероятностных тематических моделях для транзакционных данных. 2020. ВМК МГУ.
Никита Юдин. Вариационный вывод в нейронных стохастических дифференциальных уравнениях. 2020. ВМК МГУ.
Николай Герасименко. Тематический поиск в коллекции юридических документов. 2020. МАИ.
Дарья Соболева. Замена живой речи на синтетическое аудио для предсказания знаков пунктуации на устройстве пользователя. 2021. ВМК МГУ.
Николай Скачков. Совместное обучение прямой и обратной модели машинного перевода. 2021. ВМК МГУ.
Вадим Кислинский. Многокритериальная оптимизация в задаче персональных рекомендаций. 2021. ФПМИ МФТИ.
Евгений Козлинский. Методы тематической классификации коротких текстовых объявлений. 2021. ФПМИ МФТИ.
Анна Рогозина. Обучение моделей распространения рисков по графам. 2021. ФПМИ МФТИ.
Светлана Крыжановская. Технология полуавтоматической суммаризации тематических подборок научных статей. 2022. ВМК МГУ.
Евгения Милюта. Языковые модели для обнаружения поляризации общественного мнения в новостном потоке. 2022. ВМК МГУ.
Виктор Панкратов. Вероятностное тематическое моделирование неcбалансированных текстовых коллекций. 2023. ФПМИ МФТИ.
Арсений Веселов. Оценивание когнитивной сложности текста при помощи квантильного подхода и агрегирования. 2023. ВМК МГУ.

Дипломные работы

Максим Янпольский. Идентификация инвестиционных стратегий участников биржевых торгов. 2002. ВМК МГУ.
Александр Киселев. Классификация участников биржевого рынка по близости к стратегиям технического анализа. 2003. ВМК МГУ.
Андрей Липасти. Метрические алгоритмы анализа биржевых стратегий и поведения участников торгов. 2003. ВМК МГУ.
Денис Старых. Алгоритмы генерации сигналов в потоке торговых данных. 2003. ВМК МГУ.
Денис Якубенков. Применение методов распознавания при построении и настройке имитационной модели биржевых торгов. 2003. ВМК МГУ.
Екатерина Егорова. Сравнительный анализ методов алгебраической коррекции для одного класса алгоритмов прогнозирования. 2005. ВМК МГУ.
Даниил Каневский. Генетические алгоритмы синтеза локальных базисов в алгебраическом подходе к проблеме распознавания. 2005. ВМК МГУ.
Алексей Колосков. Применение комбинаторных оценок обобщающей способности для повышения качества метрических алгоритмов классификации. 2005. ВМК МГУ.
Дмитрий Соколов. Сравнительный анализ обобщающей способности логических алгоритмов классификации. 2005. ВМК МГУ.
Людмила Романюха. Логические алгоритмы классификации в задачах кредитного скоринга и оценка риска кредитного портфеля банка. 2006. ВМК МГУ.
Ирек Ахуньянов. Применение модифицированного метода опорных векторов для построения метрических классификаторов. 2008. ВМК МГУ.
Андрей Венжега. Отбор информативных признаков на выборках небольшой длины в задаче линейной регрессии с фиксированными ко-эффициентами. 2009. ВМК МГУ.
Максим Иванов. Эффективные метрические алгоритмы классификации на основе оптимизации профиля компактности. 2009. ВМК МГУ.
Алексей Медведев. Обобщающая способность логических закономерностей. 2009. ВМК МГУ.
Варвара Цурко. Логические алгоритмы классификации: проблема переобучения и применение в задачах медицинской диагностики. 2009. ВМК МГУ.
Григорий Чижик. Распознавание скрытых профилей пользователей и ресурсов в анализе клиентских сред. 2009. ВМК МГУ.
Алексей Гуков. Оценки вероятности переобучения для некоторых связных семейств алгоритмов. 2010. ВМК МГУ.
Алина Карпинская. Методы построения неполносвязных нейронных сетей и их приложения в задачах прогнозирования. 2010. ВМК МГУ.
Василий Ломакин. Поиск взаимосвязей во временных рядах продаж. 2010. ВМК МГУ.
Илья Решетняк. Комбинаторные оценки вероятности переобучения, учитывающие эффекты расслоения и связности в семействах алгоритмов. 2010. ВМК МГУ.
Илья Толстихин. Оценки обобщающей способности и применение логических алгоритмов классификации в задаче распознавания вторичной структуры белка. 2010. ВМК МГУ.
Александр Ерошенко. Применение оценок обобщающей способности в алгоритмах построения решающих деревьев. 2011. ВМК МГУ.
Мария Когадеева. Математическая модель данных микрочипов ДНК и методы оценки её параметров. 2011. ВМК МГУ.
Жанна Кожахметова. Построение карты дорог по данным о треках автотранспортных средств. 2011. ВМК МГУ.
Юрий Логачёв. Методы ранжирования в задаче текстовой релевантности. 2011. ВМК МГУ.
Елена Полежаева. Инкрементные матричные разложения в задачах коллаборативной фильтрации. 2011. ВМК МГУ.
Алёна Шевцова. Отбор информативных признаков в задачах медицинской диагностики. 2011. ВМК МГУ.
Александр Колесников. Прогнозирование вероятности кликов на новые рекламные объявления. 2012. ВМК МГУ.
Дмитрий Солодкин. Выявление закономерностей научного цитирования на основе вероятностных тематических моделей. 2012. ВМК МГУ.
Марина Дударенко. Методы предсказания информативности логических закономерностей. 2012. ВМК МГУ.
Ольга Исупова. Выявление тематических связей между документами методами латентного семантического анализа. 2012. ВМК МГУ.
Шаура Ишкина. Вероятность переобучения прямых цепей алгоритмов классификации. 2013. Мехмат МГУ.
Мария Василевская. Алгоритмы построения разреженных тематических моделей. 2013. Мехмат МГУ.
Кирилл Гаврилюк. Методы построения иерархических тематических моделей коллекции текстовых документов. 2013. ВМК МГУ.
Валентин Полежаев. Обучаемые методы извлечения наукометрической информации из коллекций научных публикаций. 2013. ВМК МГУ.
Евгений Соколов. Комбинаторные оценки обобщающей способности и их применение для построения композиций линейных классификаторов. 2013. ВМК МГУ.
Иван Шанин. Методы анализа электрокардиограмм для ранней диагностики ишемической болезни. 2013. ВМК МГУ.
Анна Потапенко. Лингвистическая регуляризация вероятностных тематических моделей. 2014. ВМК МГУ.
Андрей Шадриков. Алгоритмы неотрицательных матричных разложений для тематического моделирования. 2015. ВМК МГУ.
Тимур Исмагилов. Частично обучаемые вероятностные тематические модели коллекций научных текстов. 2016. ВМК МГУ.

Кандидатские диссертации

Андрей Ивахненко. Комбинаторные оценки вероятности переобучения и их применение в логических алгоритмах классификации. МФТИ. 2010.
Иван Гуз. Комбинаторные оценки полного скользящего контроля и методы обучения монотонных классификаторов. ВЦ РАН. 2011.
Денис Кочедыков. Оценки обобщающей способности на основе характеристик расслоения и связности семейств функций. ВЦ РАН. 2011.
Павел Ботов. Оценки вероятности переобучения многомерных семейств алгоритмов классификации. ВЦ РАН. 2011.
Василий Лексин. Вероятностные модели в анализе клиентских сред. ВЦ РАН. 2011.
Павел Кудинов. Адаптивные методы извлечения информации из статистических таблиц, представленных в текстовом виде. ВЦ РАН. 2012.
Кирилл Чувилин. Автоматический синтез правил коррекции текстовых документов формата LaTeX. ВЦ РАН. 2013.
Александр Фрей. Теоретико-групповой подход в комбинаторной теории переобучения. ВЦ РАН. 2013.
Илья Толстихин. Неравенства концентрации вероятностной меры в трансдуктивном обучении и PAC-Байесовском анализе. ВЦ РАН. 2014.
Евгений Рябенко. Выбор функций потерь в задачах неотрицательного матричного разложения. ВЦ РАН. 2014.
Никита Животовский. Минимаксные оценки риска в задачах статистического обучения. МФТИ, ИППИ РАН. 2018.
Анастасия Зухба. Оценка вычислительной сложности задач отбора эталонных объектов и признаков. МФТИ. 2018.
Илья Трофимов. Разработка и обоснование методов параллельного покоординатного спуска для обучения обобщённых линейных моделей с регуляризацией. ФИЦ ИУ РАН. 2019.
Анна Потапенко. Семантические векторные представления текста на основе вероятностного тематического моделирования. ФИЦ ИУ РАН. 2019.
Мурат Апишев. Эффективная реализация алгоритмов тематического моделирования с аддитивной регуляризацией. ФИЦ ИУ РАН. 2020.
Илья Ирхин. Единственность матричного разложения и сходимость регуляризованных алгоритмов в вероятностном тематическом моделировании. ФИЦ ИУ РАН. 2020.
Виктор Булатов. Методы оценивания качества и многокритериальной оптимизации тематических моделей в библиотеке TopicNet. МФТИ. 2020.
Анастасия Янина. Тематические и нейросетевые модели языка для разведочного информационного поиска. МФТИ. 2022.

Cсылки

Цивилизационная идеология — канал на Яндекс.Дзен
Домашняя страница К. В. Воронцова на сайте ВЦ РАН (устарела)
K.Vorontsov homepage — то же, там же, но на английском
K.Vorontsov — страница на mathnet.ru
FRC
Forecsys
google.com/+KonstantinVorontsov

Мои подстраницы

Vokov/CV	Vokov/Publications	Vokov/Вики-ресурс MachineLearning.RU: концепция и перспективы
Vokov/Иллюзия простоты выбора	Vokov/Интервью для InTalent.pro	Vokov/Интервью для Кота Шрёдингера 2017-10-04
Vokov/Интервью для Новой газеты 2019-02-25	Vokov/Интервью для ПостНауки 2017-09-27	Vokov/Интервью для РИА Новости 2020-05-25
Vokov/Комбинаторная статистика	Vokov/Научпоп	Vokov/Некоторые задачи интеллектуального анализа данных (лекция)
Vokov/Песочница	Vokov/Планы по развитию MachineLearning.RU	Vokov/Публикации

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Vokov»

Категория: Страницы участников

Участник:Vokov

Материал из MachineLearning.

Версия 21:52, 6 июня 2024

Содержание

Учебные материалы

Курсы лекций

Рекомендации для студентов и аспирантов

Интервью, выступления, блоги

Блоги

Видео, подкасты

Лонгриды

Российский радиоуниверситет, Радио России

Доклады на конференциях и семинарах

Научные интересы

Анализ текстов и информационный поиск

Фейковые новости и потенциально опасный дискурс

Отслеживание контактов и оценка рисков инфицирования

Теория обобщающей способности

Комбинаторная (перестановочная) статистика

Прогнозирование объёмов продаж

Другие проекты и семинары

Публикации

Софт и проекты

Аспиранты и студенты

Бакалаврские диссертации

Магистерские диссертации

Дипломные работы

Кандидатские диссертации

Cсылки

Мои подстраницы

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты

@@ Строка 2: / Строка 2: @@
 {| style="border:0px;"
 |-
-|[[Изображение:VorontsovFace.jpg]]&nbsp;&nbsp;&nbsp;
+|[[Изображение:VorontsovFace.jpg|150px]]&nbsp;&nbsp;&nbsp;
 |'''Воронцов Константин Вячеславович'''
-д.ф.-м.н.
+профессор РАН, д.ф.-м.н.,
 <br/>
-Зам. директора по науке [[Компания Forecsys|ЗАО «Форексис»]], [http://www.forecsys.ru www.forecsys.ru].
+проф., зав. каф. «[[Математические методы прогнозирования (кафедра ВМК МГУ)|Математические методы прогнозирования]]» [[ВМК МГУ]],
 <br/>
-С.н.с. [[Вычислительный центр РАН|Вычислительного центра РАН]].
+зав. лаб. «Машинное обучение и семантический анализ» [https://iai.msu.ru Института искусственного интеллекта] [[МГУ]]
 <br/>
-Зам. зав. каф. «[[Интеллектуальные системы (кафедра МФТИ)|Интеллектуальные системы]]» [[ФУПМ]] [[МФТИ]].
+зав. каф. «Машинного обучения и цифровой гуманитаристики» [[МФТИ]],
 <br/>
-Доц. каф. «[[Математические методы прогнозирования (кафедра ВМиК МГУ)|Математические методы прогнозирования]]» [[ВМиК МГУ]].
+проф. каф. «[https://intsystems.github.io/ru Интеллектуальные системы]» [[МФТИ]] ([[Интеллектуальные системы (кафедра МФТИ)|см.также]]),
 <br/>
-Преподаватель [[ШАД|Школы анализа данных Яндекс]].
+г.н.с. отдела «Интеллектуальные системы» [[Вычислительный центр РАН|Вычислительного центра ФИЦ ИУ РАН]],
+<br/>
+<!--зам. директора по науке [[Компания Forecsys|ЗАО «Форексис»]], [http://www.forecsys.ru www.forecsys.ru],
+<br/>-->
+один из идеологов и [[ML:АДМ|Администраторов]] ресурса '''MachineLearning.RU''',
+<br/>
+подробнее — на подстранице '''[[Участник:Vokov/CV|Curriculum vitæ]]'''.
+|}
-Один из идеологов и [[ML:АДМ|Администраторов]] ресурса '''MachineLearning.RU'''.
+* [http://orcid.org/0000-0002-4244-4270 Профиль ORCID = 0000-0002-4244-4270]
+* [https://www.scopus.com/authid/detail.uri?authorId=6507982932 Профиль SCOPUS ID = 6507982932]
-Прочие подробности — на подстранице '''[[Участник:Vokov/CV|Curriculum vitæ]]'''.
+* [http://www.researcherid.com/rid/G-7857-2014 Профиль WoS ResearcherID = G-7857-2014]
+* [http://scholar.google.com/citations?user=KIW4fnsAAAAJ Профиль Google Scholar]
+* [https://dblp.uni-trier.de/pid/258/0122.html Профиль DBLP]
+* [http://elibrary.ru/author_items.asp?authorid=15081 Профиль РИНЦ ID = 15081]
+* [http://istina.msu.ru/profile/vokov Профиль в системе ИСТИНА IRID = 3151446]
+* [http://www.mathnet.ru/php/person.phtml?personid=42083&option_lang=rus Профиль MathNet.ru]
 '''[[Служебная:EmailUser/Vokov|Мне можно написать письмо]]'''.
-|}
+http://www.MachineLearning.ru/wiki?title=User:Vokov — короткая ссылка на эту страницу.
 <!--
 <div style="padding-top=1em;">
@@ Строка 36: / Строка 48: @@
 == Учебные материалы ==
 === Курсы лекций ===
-* [[Машинное обучение (курс лекций, К.В.Воронцов)|Математические методы обучения по прецедентам (машинное обучение)]] — годовой курс, [[Интеллектуальные системы (кафедра МФТИ)|кафедра «Интеллектуальные системы»]] [[ФУПМ]] [[МФТИ]] и [[Математические методы прогнозирования (кафедра ВМиК МГУ)|кафедра ММП]] [[ВМиК МГУ]].
+* [[Машинное обучение (курс лекций, К.В.Воронцов)|Машинное обучение]] — годовой курс, [[Интеллектуальные системы (кафедра МФТИ)|кафедра «Интеллектуальные системы»]] [[ФУПМ]] [[МФТИ]] и [[Математические методы прогнозирования (кафедра ВМК МГУ)|кафедра ММП]] [[ВМК МГУ]].
-* [[Теория надёжности обучения по прецедентам (курс лекций, К. В. Воронцов)|Теория надёжности обучения по прецедентам]] — спецкурс, [[Математические методы прогнозирования (кафедра ВМиК МГУ)|кафедра ММП]] [[ВМиК МГУ]].
+* [[Математические методы анализа текстов (МФТИ) / 2021|Математические методы анализа текстов]] — семестровый курс, [[Интеллектуальные системы (кафедра МФТИ)|кафедра «Интеллектуальные системы»]] [[ФУПМ]] [[МФТИ]] и [[Математические методы прогнозирования (кафедра ВМК МГУ)|кафедра ММП]] [[ВМК МГУ]]
-* [[Статистический анализ данных (курс лекций, К.В.Воронцов)|Прикладной статистический анализ данных]] — семестровый курс, [[Математические методы прогнозирования (кафедра ВМиК МГУ)|кафедра ММП]] [[ВМиК МГУ]]; альтернативный семестровый курс, [[ФУПМ]] [[МФТИ]].
+* [[Вероятностные тематические модели (курс лекций, К.В.Воронцов)|Вероятностные тематические модели]] — семестровый курс, [[Интеллектуальные системы (кафедра МФТИ)|кафедра «Интеллектуальные системы»]] [[ФУПМ]] [[МФТИ]] и спецкурс на [[Математические методы прогнозирования (кафедра ВМК МГУ)|кафедре ММП]] [[ВМК МГУ]].
+* [[Теория надёжности обучения по прецедентам (курс лекций, К. В. Воронцов)|Теория надёжности обучения по прецедентам]] — спецкурс, [[Математические методы прогнозирования (кафедра ВМК МГУ)|кафедра ММП]] [[ВМК МГУ]].
-=== Семинары ===
+* [[Статистический анализ данных (курс лекций, К.В.Воронцов)|Прикладной статистический анализ данных]] — семестровый курс, [[Математические методы прогнозирования (кафедра ВМК МГУ)|кафедра ММП]] [[ВМК МГУ]]; альтернативный семестровый курс, [[ФУПМ]] [[МФТИ]].
-* [[Задачи анализа данных в бизнес-аналитике (семинар К. В. Воронцова)]]
-* [[Семинар К. В. Рудакова]] — регулярный '''не виртуальный''' семинар (следите за объявлениями!)
-* [[Расслоение и сходство алгоритмов (виртуальный семинар)]]
-* [[Анализ клиентских сред и коллаборативная фильтрация (виртуальный семинар)]]
 === Рекомендации для студентов и аспирантов ===
+Каждый студент, с которым мы начинаем совместную научную работу, должен внимательно прочитать и осмыслить:
 * [[Научно-исследовательская работа (рекомендации)]]
 * [[Написание отчётов и статей (рекомендации)]]
 * [[Подготовка презентаций (рекомендации)]]
 * [[Защита выпускной квалификационной работы (рекомендации)]]
+Другие методические материалы:
+* [[Обзорные статьи на английском языке]] — рекомендуется студентам младших курсов в качестве текстов по специальности
 * [[Требования к кандидатской диссертации]]
-* [[Обзорные статьи на английском языке]] — рекомендуется студентам младших курсов в качестве текстов по специальности
-=== Методические рекомендации для преподавателей ===
+== Интервью, выступления, блоги ==
-* [[MachineLearning:Учебный процесс]]
-* [[Преподавание машинного обучения]]
+=== Блоги ===
-* [[Коллекция учебных задач]]
+* [https://zen.yandex.ru/civideology Цивилизационная идеология] — канал на Яндекс.Дзен
+=== Видео, подкасты ===
+* 18 августа 2023. [https://dzen.ru/video/watch/64de681bc311451c1a85f087 Игры разума: зачем нам искусственный интеллект и кто из нас умнее?]. Метод Сократа.
+* 19 мая 2023. [https://www.youtube.com/watch?v=BHJOgmhmp5E Искусственный интеллект: прошлое, настоящее и чего ожидать в будущем]. НаукаPRO.
+* 23 января 2023. [https://youtu.be/QrqRojIMK4U?t=452 О математике, ИИ и судьбе цивилизации]. Machine Learning Podcast.
+* 27 июня 2022. [https://www.youtube.com/watch?v=Rt7KYGU9JuM От постправды к неопровержимой лжи]. Научная Россия.
+* 18 июня 2022. [https://www.youtube.com/watch?v=5PhgYK_Zj1I Как предотвратить риски и угрозы искусственного интеллекта]. ДеньТВ.
+* 29 мая 2022. [https://m.youtube.com/watch?v=1lWtV1Qg5QM С чего начинается уничтожение человечества. Как цивилизация машин может сменить цивилизацию людей]. ДеньТВ.
+* 21 декабря 2021. [https://youtu.be/B44hFC0nl54?t=4857 Интеллект искусственный и естественный: взболтать, не смешивать]. Блог компании SuperJob.
+* 20 декабря 2021. [https://dengi-lyubyat-tehno.simplecast.com/episodes/zachem-data-sayentistu-latyn-i-rimskoe-pravo Зачем дата-сайентисту латынь и римское право]. Деньги любят техно.
+* 14 сентября 2021. [https://www.uhnwidata.com/den-of-rich/konstantin-vorontsov Искусственный интеллект, этика ИИ, биологическая сингулярность и цивилизационная идеология]. Подкаст [https://www.uhnwidata.com/podcast Den of Rich].
+* 18 июля 2021. [https://www.youtube.com/watch?v=ZILLONshB78 Искусственный интеллект на грани нервного срыва]. ДеньТВ.
+* 15 июля 2021. [https://www.youtube.com/watch?v=_P2N5W-c9rQ О математике, ИИ, фейковых новостях и демократии]. Маткульт-привет! :: Алексей Савватеев и Ко.
+* 4 июня 2021. [https://youtu.be/nYCO6hs7eNI Всё об искусственном интеллекте]. Подкаст Nadmitov Live.
+* 19 мая 2021. [https://youtu.be/aQUj7YVSjJs?t=572 «Безопасность от интеллекта»]. Дискуссия с философом Софьей Дойко. Поговорим за науку, МФТИ.
+* 24 февраля 2021. [https://youtu.be/MG2bX-M__4A «Искусственный интеллект, нейронные сети и профессии будущего»]. The human show ПОДКАСТ.
+* 28 декабря 2020. [https://podcasts.google.com/feed/aHR0cHM6Ly9hbmNob3IuZm0vcy8xMmRhMDE2Yy9wb2RjYXN0L3Jzcw/episode/NWYyMjAxZDEtYjAyYi00ZWU2LWE1MTMtMTk5ZTdkMWNlNTBl Как строить искусственный интеллект и не погубить человеческую цивилизацию]. Системный Блок{ъ}.
+* 12 ноября 2020. [https://www.youtube.com/watch?v=Rn3GJcCQVzQ&t=5366s Искусственные нейронные сети]. Рубка ПостНауки.
+* 21 сентября 2020. [https://postnauka.ru/video/155796 Тесты Бонгарда]. ПостНаука.
+* 2 июня 2020. [https://postnauka.ru/video/154955 Недообучение и переобучение в машинном интеллекте]. ПостНаука.
+* 4 октября 2017. [https://youtu.be/DR3mgnEKRgI Интервью Юрию Кашницкому и Алексею Натекину]. [https://mlcourse.ai Открытый курс машинного обучения].
+* 21 марта 2016. [https://postnauka.ru/video/61910 Разведочный информационный поиск]. ПостНаука.
+* 24 февраля 2016. [https://postnauka.ru/video/59633 Математические методы прогнозирования объемов продаж]. ПостНаука.
+=== Лонгриды ===
+* 6 июня 2023. [https://sociodigger.ru/articles/articles-page/kak-izbezhat-oshibok-vosprijatija-dialogovogo-iskusstvennogo-intellekta Как избежать ошибок восприятия диалогового искусственного интеллекта]. СоциоДиггер, ВЦИОМ. Том 4. Выпуск 5—6 (26).
+* январь 2023. [https://dzen.ru/a/Y8srSGD9A3EifZqg Цивилизационная идеология]. Статья в сборнике [https://день-магазин.рф/38639-sverkhnovaya-rossiya-kakaya-ty-budesh-fursov-ai-prok Сверхновая Россия. Какая ты будешь?]
+* 27 июня 2022. [https://scientificrussia.ru/articles/ot-postpravdy-k-neoproverzimoj-lzi-professor-ran-konstantin-voroncov-ob-informacionnoj-bezopasnosti-i-novyh-vyzovah-epohi От постправды к «неопровержимой лжи»]. [https://en.scientificrussia.ru/articles/ot-postpravdy-k-neoproverzimoj-lzi-professor-ran-konstantin-voroncov-ob-informacionnoj-bezopasnosti-i-novyh-vyzovah-epohi-2 Перевод на английский язык]. Портал «Научная Россия».
+* 2 июня 2022. [https://zavtra.ru/blogs/tajni_boga_iz_mashini Тайны «бога из машины». Об искусственном интеллекте и цивилизационной идеологии]. Газета «Завтра».
+* 19 января 2022. [https://stimul.online/articles/science-and-technology/shkola-zhuravleva/?sphrase_id=21809 Школа Журавлева]. Стимул — журнал об инновациях в России.
+* 24 ноября 2021. [https://www.interfax.ru/russia/804681 Искусственный интеллект и информационная безопасность]. Интерфакс.
+* 5 ноября 2021. [https://zavtra.ru/blogs/imitatciya_intellekta Имитация интеллекта. «Цифровая магия» и её разоблачение]. Газета «Завтра».
+* 9 февраля 2021. [https://postnauka.ru/wtf/155978 Обучение нейронных сетей]. ПостНаука.
+* 11 декабря 2020. [https://postnauka.ru/wtf/156053 Глубокая нейронная сеть]. ПостНаука.
+* 4 декабря 2020. [https://postnauka.ru/longreads/155977 Искусственные нейронные сети: архитектуры и обучение]. ПостНаука.
+* 28 декабря 2020. [https://sysblok.ru/podcasts/7595 Как строить искусственный интеллект и не погубить человеческую цивилизацию]. Системный Блок{ъ}.
+* 25 мая 2020. [[Участник:Vokov/Интервью для РИА Новости 2020-05-25|Искусственный интеллект освободит учителя от рутины]]. РИА Новости.
+* 25 февраля 2019. [[Участник:Vokov/Интервью для Новой газеты 2019-02-25|15 тезисов о машинном обучении]]. Новая газета.
+* 15 июня 2018. [https://postnauka.ru/faq/86373 Тематическое моделирование]. ПостНаука.
+* 31 мая 2018. [https://postnauka.ru/faq/86374 Есть ли альтернатива искусственным нейронным сетям?] ПостНаука.
+* 4 октября 2017. [[Участник:Vokov/Интервью для Кота Шрёдингера 2017-10-04| Универсальный солдат big data: Как освоить самую популярную профессию]]. Кот Шрёдингера.
+* 29 сентября 2017. [https://postnauka.ru/faq/80038 Культура анализа данных в эру машинного обучения]. ПостНаука.
+* 27 сентября 2017. [[Участник:Vokov/Интервью для ПостНауки 2017-09-27|Прогресс нейронных сетей]]. ПостНаука.
+* 31 декабря 2016. [[Участник:Vokov/Интервью для InTalent.pro|О науке о данных и машинном обучении]]. InTalent.pro.
+=== Российский радиоуниверситет, Радио России ===
+* [https://www.radiorus.ru/person/340483 Все эпизоды]
+* 5 февраля 2020. [https://www.radiorus.ru/brand/63253/episode/2241653 Исследования, разработки и перспективы ИИ в России], совместно с Игорем Пивоваровым.
+* 13 января 2020. [https://www.radiorus.ru/brand/63253/episode/2235758 Искусственный интеллект – наука, ремесло или спорт?], совместно с Александром Дьяконовым.
+* 16 декабря 2019. [https://www.radiorus.ru/brand/63253/episode/2229416 Вас обслуживает чатбот-юрист. Автоматизация юридических консультаций], совместно с Сергеем Переверзевым.
+* 29 октября 2019. [https://www.radiorus.ru/brand/63253/episode/2214263 iPavlov – когда машины будут свободно говорить как люди], совместно с Михаилом Бурцевым.
+* 15 октября 2019. [https://www.radiorus.ru/brand/63253/episode/2210583 Чатботы, нейросети и естественная речь машин], совместно с Сергеем Николенко.
+* 1 октября 2019. [https://www.radiorus.ru/brand/63253/episode/2206854 Big data: искусственный интеллект в мире больших данных].
+* 17 сентября 2019. [https://www.radiorus.ru/brand/63253/episode/2201775 Чему машины учатся у людей?]
-== Выступления на конференциях и семинарах ==
+== Доклады на конференциях и семинарах ==
-* 12 сентября 2011. Комбинаторная теория переобучения и поиск логических закономерностей. Доклад на конференции [[ММРО|ММРО-15]], Петрозаводск. '''[[Media:voron11mmro-talk.pdf|(PDF,&nbsp;1403&nbsp;КБ)]]'''.
+* 6 июня 2024. Карты знаний: усиление коллективного естественного интеллекта. [https://agirussia.org Семинар русскоязычного сообщества AGI]. '''[[Media:voron2024-06-06.png|(PNG,&nbsp;1.6&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=EQY6VSBaPnU Видеозапись]'''.
+* 27 мая 2024. Карты знаний: на пути к доверенным языковым моделям и системам представления знаний. [https://ib-bank.ru/trust-ai/ Форум «Технологии доверенного искусственного интеллекта»]. '''[[Media:voron2024-05-27.pdf|(PDF,&nbsp;2.8&nbsp;МБ)]]'''.
+* 20 мая 2024. Эволюция идей машинного обучения от Фрэнсиса Бэкона до больших языковых моделей. Всероссийский семинар по искусственному интеллекту для студентов, аспирантов и молодых ученых. [https://raai.org/ Российская ассоциация искусственного интеллекта]. '''[[Media:voron2024-05-20-raai.pdf|(PDF,&nbsp;7.2&nbsp;МБ)]]'''. '''[https://youtu.be/1u2ELWvohiw?t=89 Видеозапись]'''.
+* 20 мая 2024. Нейросетевые языковые модели для поиска и анализа научных публикаций. XIV Международная молодежная научно-практическая конференция с элементами научной школы «Прикладная математика и фундаментальная информатика» (ПМиФИ 2024). ОмГТУ, Омск. '''[[Media:voron2024-05-20-omsk.pdf|(PDF,&nbsp;2.2&nbsp;МБ)]]'''.
+* 17 апреля 2024. Машина, будь человеком! [https://data-fusion.ru/ Data Fusion 2024]. '''[[Media:Voron-2024-04-17-df.pdf|(PDF,&nbsp;5.7&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=bjgkjOyRZGw Видеозапись]'''.
+* 17 апреля 2024. Эволюция идей искусственного интеллекта: история развития и связь с практикой. Конгресс «Молекулярная диагностика и биобезопасность-2024», секция «Эпидемиологический анализ и прогнозирование в условиях цифровой трансформации» '''[[Media:voron2024-04-17-mdb.pdf|(PDF,&nbsp;4.1&nbsp;МБ)]]'''. '''[https://disk.yandex.ru/i/z8IMjMPih-J7CA Видеозапись]'''.
+* 12 апреля 2024. Цивилизационная идеология. Физтех-Союз, Энотека-IQ. '''[[Media:Voron-2024-04-12.png|(PNG,&nbsp;2.6Мб)]]'''. '''[https://youtu.be/yMlGNtyqnz0 Видеозапись]'''.
+* 10 апреля 2024. Проект «Мастерская знаний». Научный семинар по анализу данных Московского городского педагогического университета. '''[[Media:Voron-2024-04-10-kf.pdf|(PDF,&nbsp;2.8&nbsp;МБ)]]'''.
+* 10 апреля 2024. Нейросетевые модели разметки текста: от выявления манипулятивных воздействий к автоматизации контент-анализа. Международная научная конференция «Манипулятивные процессы в медиадискурсе: реальность, ментальные модели, язык», РГГУ. '''[[Media:Voron-2024-04-10-nc.pdf|(PDF,&nbsp;5.4&nbsp;МБ)]]'''.
+* 28 марта 2024. Карты знаний: Антропоцентричная система представления знаний в будущей человеко-машинной цивилизации. [https://end-to-end-2024.tilda.ws/ Всероссийский педагогический форум «Цифровая дидактика», Всероссийская научно-практическая конференция «Сквозные технологии в преподавании физики, математики, информатики»], ПГГПУ, Пермь. '''[[Media:Voron-2024-03-28.png|(PNG,&nbsp;1.3&nbsp;МБ)]]'''. '''[https://youtu.be/2kdAMz8zV1k?t=8132 Видеозапись]'''.
+* 11 марта 2024. Карты знаний: усиление коллективного естественного интеллекта и шаг к безопасному гибридному интеллекту. [https://spa.msu.ru/11-marta-2024-goda-na-fakultete-sostoitsya-nauchnyj-seminar-karty-znanij-usilenie-kollektivnogo-estestvennogo-intellekta-i-shag-k-bezopasnomu-gibridnomu-intellektu Научный семинар Факультета государственного управления], МГУ. '''[[Media:Voron-2024-03-11.pdf|(PDF,&nbsp;2.5&nbsp;МБ)]]'''. '''[https://youtu.be/oESgtUROvEM?t=179 Видеозапись]'''.
+* 21 февраля 2024. Мастерская знаний. Научный семинар «Проблемы управления знаниями», ИПУ РАН. '''[[Media:voron24ipu.pdf|(PDF,&nbsp;2.4&nbsp;МБ)]]'''. '''[https://youtu.be/gyumGiQquuM?t=3565 Видеозапись]'''.
+* 19 декабря 2023. О подготовке кадров для цифровой экономики. Круглый стол «Вызовы, риски и проблемы системы образования РФ в среднесрочной перспективе». Общественная Палата РФ. '''[[Media:Voron-2023-12-19.pdf|(PNG,&nbsp;1.5Мб)]]'''.
+* 18 декабря 2023. Анти-Курцвейл: как думать о будущем искусственного интеллекта и о будущем вообще. Цикл научно-популярных лекций для молодёжи «Научное кафе», Тульский государственный университет. '''[[Media:Voron-2023-12-18.png|(PNG,&nbsp;2.6Мб)]]'''.
+* 12 декабря 2023. О некоторых фундаментальных проблемах технологий искусственного интеллекта. [[Математические методы распознавания образов (конференция)]]. '''[[Media:voron23mmpr.pdf|(PDF,&nbsp;5.3&nbsp;МБ)]]'''.
+* 11 декабря 2023. Фундаментальные проблемы технологий искусственного интеллекта. Общее собрание Отделения математических наук РАН. '''[[Media:Voron-2023-12-11.pdf|(PDF,&nbsp;5.2Мб)]]'''.
+* 8 декабря 2023. Модели векторизации текста для семантического поиска и формализации гуманитарных знаний. Международная молодежная научная конференция «Технологии ИИ в науке и образовании», МГУ. '''[[Media:Voron-2023-12-08.pdf|(PDF,&nbsp;9.0Мб)]]'''.
+* 1 декабря 2023. Дилеммы развития искусственного интеллекта: чем заниматься — создавать возможности или устранять угрозы? Визионерская лекция. Школа прикладного анализа больших данных. Томский государственный университет. '''[[Media:Voron-2023-12-01.png|(PNG,&nbsp;1.1Мб)]]'''. '''[https://www.youtube.com/live/jixqRndY6_s Видеозапись]'''.
+* 23 ноября 2023. Цивилизационная идеология: мысли о будущем искусственного интеллекта и о будущем вообще. [https://asvk.cs.msu.ru/krugozor Лекторий «Кругозор»], МГУ. '''[[Media:Voron-civ-2023-11-23.png|(цивилизация-PNG,&nbsp;67Кб)]]''', '''[[Media:Voron-ideo-2023-11-23.png|(идеология-PNG,&nbsp;164Кб)]]''', '''[[Media:Voron-civ-ideo-2023-11-23.png|(цивилизационная-идеология-PNG,&nbsp;1,6Мб)]]'''. '''[https://www.youtube.com/embed/snfORWIhz9I Видеозапись]'''.
+* 23 ноября 2023. О преподавании искусственного интеллекта и машинного обучения: от школы до университета. Всероссийский съезд учителей и преподавателей математики, МГУ. '''[[Media:Voron-2023-11-23.pdf|(PDF,&nbsp;3.0Мб)]]'''. '''[https://vk.com/video-78019879_456241021?t=2h36m18s Видеозапись]'''.
+* 18 ноября 2023. Тематика НИР: математические методы анализа текстов и~информационного поиска. Семинар магистрантов AI Masters. '''[[Media:Voron-2023-11-18.pdf|(PDF,&nbsp;8.3Мб)]]'''.
+* 12 ноября 2023. Профессия «искусственный интеллект, анализ данных и машинное обучение». День Открытых Дверей, ВМК МГУ. '''[[Media:Voron-2023-11-12.pdf|(PDF,&nbsp;3.3Мб)]]'''.
+* 11 ноября 2023. Большие языковые модели для автоматизации разметки текстов. [https://opendataforum.ru Форум «Открытые данные»], Томск. Панельная сессия «Информационное воздействие. ИИ для анализа культурных кодов». '''[[Media:Voron-2023-11-11.pdf|(PDF,&nbsp;3.3Мб)]]'''.
+* 10 ноября 2023. Сценарии использования BigARTM: тематический анализ текстовых и мультимодальных данных. [https://opendataforum.ru Форум «Открытые данные»], Томск. '''[[Media:Voron-2023-11-10.pdf|(PDF,&nbsp;7.2Мб)]]'''.
+* 25 октября 2023. Большие языковые модели для автоматизации разметки текстов. [https://mgimodigital.ru «Цифровые международные отношения 2023», секция «ИИ в международных исследованиях», МГИМО]. '''[[Media:Voron-2023-10-25.pdf|(PDF,&nbsp;3.0Мб)]]'''. '''[https://youtu.be/G5wH5_MitDU?t=2468 Видеозапись]'''.
+* 24 октября 2023. Технологии искусственного интеллекта: глубокие нейронные сети, большие языковые модели, фундаментальные модели, что дальше? [https://istina.msu.ru/seminars/52861896/main Научный семинар «Проблемы современных информационно-вычислительных систем», МГУ]. '''[[Media:Voron-2023-10-24.png|(PNG,&nbsp;2.2Мб)]]'''. '''[https://rutube.ru/video/752c2e1ddb53f2746525b86b874737d0 Видеозапись]'''.
+* 8 сентября 2023. Технологии искусственного интеллекта, их влияние на общество, рынок труда, образование. I Всероссийский форум руководителей финансового-экономических блоков организаций высшего образования МФТИ. '''[[Media:Voron-2023-09-08.png|(PNG,&nbsp;0.9Мб)]]'''. '''[https://vk.com/video/@miptru?z=video-932_456240157%2Fclub932%2Fpl_-932_-2 Видеозапись]'''.
+* 5 сентября 2023. Оптимизация на единичных симплексах для обучения тематических моделей и нейронных сетей. [https://siriusmathcenter.ru/program/009s Научная школа «Обратные некорректные задачи и машинное обучение»]. '''[[Media:Voron-2023-09-05.pdf|(PDF,&nbsp;2.4Мб)]]'''.
+* 17 августа 2023. Интерпретируемость  и объяснимость моделей машинного обучения. Международный военно-технический форум «АРМИЯ-2023». [https://rusarmyexpo.ru/business_program/42722/43456.html Секция №4 «Научная проблематика в области искусственного интеллекта»] '''[[Media:Voron-2023-08-17.pdf|(PDF,&nbsp;2.2Мб)]]'''.
+* 12 июля 2023. Оптимизация на единичных симплексах для обучения тематических моделей и нейронных сетей. [https://ssopt.org/ Традиционная молодежная летняя школа «Управление, информация и оптимизация» им. Б. Т. Поляка]. '''[[Media:Voron-2023-ssopt.pdf|(PDF,&nbsp;2.7Мб)]]'''. '''[https://youtu.be/B6NH8zsMvYQ?t=3674 Видеозапись]'''.
+* 30 июня 2023. Унификация фрагментной разметки текста и оценивания моделей разметки для формализации гуманитарных знаний. [https://congrsysalgbai.ru Всемирный Конгресс «Теория систем, алгебраическая биология, искусственный интеллект: математические основы и приложения»]. '''[[Media:Voron-2023-06-30.pdf|(PDF,&nbsp;3.5Мб)]]'''. '''[https://youtu.be/eZc1XaZ6LNc?t=19192 Видеозапись]'''.
+* 17 мая 2023. Задачи и технологии вероятностного тематического моделирования (к обсуждению возможностей их применения в биоинформатике). Научный семинар Института ИИ МГУ. '''[[Media:Voron-2023-05-17.pdf|(PDF,&nbsp;7.8Мб)]]'''.
+* 26 апреля 2023. Искусственный интеллект: эволюция идей от Фрэнсиса Бэкона до векторных трансформеров и ChatGPT. [https://raai.org/pages/UGFnZVR5cGU6MjIxNw== «Проблемы искусственного интеллекта» — совместный научный семинар Российской ассоциации искусственного интеллекта и ФИЦ «Информатика и управление» РАН] '''[[Media:Voron-2023-04-26.pdf|(PDF,&nbsp;5.5Мб)]]'''.
+* 19 апреля 2023. Искусственный интеллект: эволюция идей от Фрэнсиса Бэкона до фундаментальных моделей и ChatGPT. Научный семинар под руководством академика РАН, профессора В.А.Садовничего, МГУ. '''[[Media:Voron-2023-04-19.pdf|(PDF,&nbsp;4.8Мб)]]'''.
+* 10 апреля 2023. О некоторых технологиях информационного поиска в текстовых массивах. Круглый стол «Практические задачи внедрения технологий искусственного интеллекта в деятельность архивов», ВНИИДАД. '''[[Media:Voron-2023-04-10.pdf|(PDF,&nbsp;6.7Мб)]]'''.
+* 4 апреля 2023. Технологии искусственного интеллекта и политика постправды. Взлёт.Диалоги, образовательный центр гимназии им. Е.М.Примакова. '''[[Media:Voron-2023-04-04.pdf|(PDF,&nbsp;4.4Мб)]]'''.
+* 27 марта 2023. Mathematical methods and applications of semantic analysis of text data. Scientific Conference «New challenges facing artificial intelligence», Tsinghua University, Beijing, China. '''[[Media:Voron-2023-03-27.pdf|(PDF,&nbsp;4.8Мб)]]'''.
+* 10 марта 2023. Технологии и приложения тематического моделирования в цифровых гуманитарных исследованиях. Методологический семинар МГИМО и ИСП РАН по анализу данных в области международных отношений. '''[[Media:Voron-2023-03-10.pdf|(PDF,&nbsp;6.8Мб)]]'''.
+* 17 февраля 2023. Технологии искусственного интеллекта против фейков, постправды и информационных войн. Заседание Экспертного совета по развитию цифровой экономики, технологий и инноваций Молодёжного парламента при Государственной думе Федерального Собрания РФ по теме «Противодействие деструктивной идеологии (нацизм, терроризм, криминал)». '''[[Media:Voron-2023-02-17.pdf|(PDF,&nbsp;1.7Мб)]]'''.
+* 11 февраля 2023. Тематический информационный поиск в цифровых гуманитарных исследованиях. Научный семинар «Искусственный интеллект в исторических исследованиях: автоматизированное распознавание текстов рукописных исторических источников». Ассоциация «История и компьютер», РАНХиГС. '''[[Media:Voron-2023-02-11.pdf|(PDF,&nbsp;5.9Мб)]]'''.
+* 30 января 2023. Переосмысление вероятностных тематических моделей с позиций классической не-байесовской регуляризации. Научная конференция «Анализ данных и оптимизация», МФТИ. '''[[Media:Voron-2023-01-30-eng.pdf|(PDF,&nbsp;8.3Мб)]]''' — английская версия, '''[[Media:Voron-2023-01-30-rus.pdf|(PDF,&nbsp;8.3Мб)]]''' — русская версия.
+* 19 января 2023. Вычислительные методы обработки естественного языка для разведочного информационного поиска, накопления, анализа и систематизации предметных знаний. Научный семинар отделения №1 ФИЦ ИУ РАН. '''[[Media:Voron-2023-01-19.pdf|(PDF,&nbsp;4.6Мб)]]'''.
+* 7 декабря 2022. Задачи понимания естественного языка: на пути к стандартизации разметки и оценивания моделей. Секционное научно-методическое заседание «Межотраслевые вопросы стандартизации искусственного интеллекта» Подкомитета 02 «Данные» (ПК02) Технического комитета по стандартизации «Искусственный интеллект» (ТК164), в рамках конференции [[Интеллектуализация обработки информации (конференция)|ИОИ-14]]. '''[[Media:Voron-2022-12-07.pdf|(PDF,&nbsp;2.4Мб)]]'''.
+* 6 декабря 2022. От алгебраического подхода Ю.И.Журавлёва к ансамблированию моделей в широком смысле. [[Интеллектуализация обработки информации (конференция)]]. '''[[Media:Voron-2022-12-06.pdf|(PDF,&nbsp;2.9Мб)]]'''.
+* 28 ноября 2022. Обзор оптимизационных задач машинного обучения: от персептрона до векторных представлений сложно структурированных данных. [https://iai.msu.ru/workshop Научный симпозиум «Искусственный интеллект и его применения»]. [https://iai.msu.ru Институт ИИ МГУ]. '''[[Media:Voron-2022-11-28.pdf|(PDF,&nbsp;3.6Мб)]]'''.
+* 25 ноября 2022. Разметка данных для обучения нейросетевых моделей языка как способ формализации гуманитарных знаний. Школа прикладного анализа больших данных. Томский государственный университет. '''[[Media:Voron-2022-11-25.pdf|(PDF,&nbsp;2.5Мб)]]'''. '''[https://youtu.be/sbV4Kqs9lbE?t=47 Видеозапись]'''.
+* 11 ноября 2022. Разметка данных для обучения нейросетевых моделей языка как способ формализации гуманитарных знаний. XVIII научная конференция межрегиональной ассоциации «История и компьютер» Историческая информатика как Historical Data Science. '''[[Media:Voron-2022-11-11.pdf|(PDF,&nbsp;2.5Мб)]]'''.
+* 27 октября 2022. Обзор задач искусственного интеллекта: от обучения персептрона до многокритериальной оптимизации векторных представлений сложно структурированных данных. [https://www.mathnet.ru/php/conference.phtml?confid=2185 Семинар Отделения математических наук РАН по проблемам искусственного интеллекта]. '''[[Media:Voron-2022-10-27.pdf|(PDF,&nbsp;3.7Мб)]]'''. '''[https://www.mathnet.ru/php/presentation.phtml?option_lang=rus&presentid=36435 Видеозапись]'''.
+* 12 октября 2022. Стандартизация разметки текста и оценивания предсказательных моделей в задачах понимания естественного языка. Конгресс «Humanities vs sciences & the knowledge accelerating in modern world: parallels and interaction». '''[[Media:Voron-2022-10-12.pdf|(PDF,&nbsp;2.2Мб)]]'''. '''[https://vk.com/video-932_456239868?t=5h33m56s Видеозапись]'''.
+* 8 октября 2022. Искусственный интеллект: мифы, реальность, перспективы. Всероссийский Фестиваль «Наука 0+». '''[[Media:Voron-2022-10-08.pdf|(PDF,&nbsp;5.1Мб)]]'''.
+* 16 августа 2022. Обучаемая векторизация данных как основа нейросетевых технологий искусственного интеллекта. Международный военно-технический форум «АРМИЯ-2022». [https://www.rusarmyexpo.ru/business_program/44032/42961.html Секция №3 «Научная проблематика в области искусственного интеллекта»] '''[[Media:Voron-2022-08-16.pdf|(PDF,&nbsp;4.8Мб)]]'''.
+* 20 мая 2022. Технологии искусственного интеллекта и безопасность информационного пространства. [https://opendata.university/congress#!/tab/428723728-2 Международный конгресс Университетского консорциума исследователей больших данных]. г.Киров, ВятГУ. '''[[Media:Voron-2022-05-20b.pdf|(PDF,&nbsp;1.7Мб)]]'''. '''[https://vk.com/video-18037_456239709 Видеозапись]'''.
+* 20 мая 2022. Технологии искусственного интеллекта против фейков, постправды и информационных войн. Заседание Экспертного совета по развитию цифровой экономики, технологий и инноваций Молодёжного парламента при Государственной думе Федерального Собрания РФ по теме «Защита суверенного информационного пространства: правовые, научно-технические и организационные меры». '''[[Media:Voron-2022-05-20a.pdf|(PDF,&nbsp;1.6Мб)]]'''.
+* 18 мая 2022. Вероятностные тематические модели: от теории регуляризации к моделям внимания. [http://konfpmfi.omgtu.ru XII Международная молодёжная научно-практическая конференция с элементами научной школы «Прикладная математика и фундаментальная информатика»]. Омский ГТУ. '''[[Media:Voron-2022-05-18.pdf|(PDF,&nbsp;7.1Мб)]]'''.
+* 17 мая 2022. Современные методы и проблемы тематического моделирования и разведочного поиска. Ежегодная конференция Российской библиотечной ассоциации XXVI. Совместное заседание: секция 08/11 по автоматизации, форматам и каталогизации 23-К. '''[[Media:Voron-2022-05-17.pdf|(PDF,&nbsp;1.7Мб)]]'''. '''[https://vk.com/video-213144162_456239017?list=ln-Dk9mZlbHMSXwSK7Z5p&t=7h40m54s Видеозапись]'''.
+* 14 апреля 2022. Технологии искусственного интеллекта против политики постправды. Международная научно-практическая конференция «Цифровые международные отношения». Секция «Машинный анализ естественного языка в международных отношениях». '''[[Media:Voron-2022-04-14.pdf|(PDF,&nbsp;1.5Мб)]]'''. '''[https://youtu.be/4qRdT4teS0E?t=378 Видеозапись]'''.
+* 17 марта 2022. Тематическое моделирование для информационного поиска. Научный семинар Центра прикладного анализа больших данных Томского государственного университета. '''[[Media:Voron-2022-03-17.pdf|(PDF,&nbsp;2.7Мб)]]'''. '''[https://youtu.be/opsXXerb09c?t=66 Видеозапись]'''.
+* 31 января 2022. Задачи выявления речевых манипуляций и поляризации общественного мнения в новостных текстах. Научный семинар Центра прикладного анализа больших данных Томского государственного университета. '''[[Media:Voron-2022-01-31.pdf|(PDF,&nbsp;1.1Мб)]]'''. '''[https://www.youtube.com/watch?v=A-GlCdWVcF4&t=144 Видеозапись]'''.
+* 7 января 2022. STEM-дисциплины (Science, Technology, Engineering, Math) – основа настоящего образования? Московская школа управления СКОЛКОВО, Образовательный интенсив «Ты. Университет. Будущее». '''[[Media:Voron-2022-01-07.pdf|(PDF,&nbsp;2.8Мб)]]'''.
+* 13 декабря 2021. Математические методы понимания естественного языка для мониторинга медиа-пространства. Заседание Общего собрания Отделения математических наук Российской академии наук «Современные математические проблемы искусственного интеллекта». '''[[Media:Voron-2021-12-13.pdf|(PDF,&nbsp;2.8Мб)]]'''.
+* 7 декабря 2021. Задачи и методы понимания естественного языка для мониторинга медиа-пространства. [[Математические методы распознавания образов (конференция)]]. '''[[Media:voron21mmpr.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''. '''[https://youtu.be/pPIsC38i8JQ?t=2700 Видеозапись]'''.
+* 23 ноября 2021. Технологии искусственного интеллекта и безопасность информационного пространства. Заседание Президиума Российской академии наук «Искусственный интеллект в контексте информационной безопасности».  '''[[Media:Voron-2021-11-23.pdf|(PDF,&nbsp;1.4Мб)]]'''. '''[https://youtu.be/cjRpLu6MOFE?t=6489 Видеозапись]'''.
+* 29 октября 2021. Обзор оптимизационных задач машинного обучения. [https://cmcm2021.mipt.ru Smart Computational Methods in Continuum Mechanics]. Конференция памяти академика О.М.Белоцерковского, МФТИ.  '''[[Media:Voron-2021-10-29.pdf|(PDF,&nbsp;1.8Мб)]]'''. '''[[Media:Voron-2021-10-29-eng.pdf|(PDF,&nbsp;1.8Мб, на английском)]]'''.
+* 24 августа 2021. Фундаментальные основы технологий ИИ. Международный военно-технический форум «АРМИЯ-2021». [https://www.rusarmyexpo.ru/business_program/business_program?id=42299 Секция №2: Отечественная научная школа и научно-технологический потенциал в области искусственного интеллекта. Вопросы подготовки кадров.] '''[[Media:Voron-2021-08-24.pdf|(PDF,&nbsp;3.9Мб)]]'''.
+* 8 июля 2021. Обзор оптимизационных задач машинного обучения. [https://cmcagu.ru/?p=5076 Школа по современной комбинаторике и теории игр], Кавказский математический центр Адыгейского государственного университета. '''[[Media:Voron-2021-07-08.pdf|(PDF,&nbsp;4.4Мб)]]'''. '''[https://www.youtube.com/watch?v=R9ELHHeSCaY Видеозапись]'''.
+* 10 июня 2021. Оценивание рисков распространения эпидемии по графу контактов методами имитационного моделирования и машинного обучения. [https://miem.hse.ru/fitm/announcements/473030549.html Круглый стол «Компьютерные симуляции в исследовании макроэкономических процессов»]. '''[[Media:Voron-2021-06-10.pdf|(PDF,&nbsp;1.2Мб)]]'''. '''[https://youtu.be/m45NCn6v5yE?t=14417 Видеозапись]'''.
+* 28 мая 2021. Искусственный интеллект в цифровых гуманитарных исследованиях. Международный коллоквиум «Искусственный интеллект. Гуманитарные науки. Концепция ЮНЕСКО» на базе НГЛУ. '''[[Media:Voron-2021-05-28.pdf|(PDF,&nbsp;3.7Мб)]]'''. '''[https://youtu.be/mhOgpla-RaU?t=4413 Видеозапись]'''.
+* 16 мая 2021. Концепция ЦИфровой ПлатФормы «ЦИПФ» для управления социальной и политической активностью молодежи. [https://youthscienceforum.mmco-expo.ru/program/bolshie-dannye-i-obshchestvo-vozmozhnosti-i-vyzovy-dlya-molodezhi Российский форум «Молодёжь и наука»], Университет Лобачевского, Нижний Новгород. '''[[Media:Voron-2021-05-16.pdf|(PDF,&nbsp;1.0Мб)]]'''. '''[https://youtu.be/mbjIJ-N5bK0?t=2474 Видеозапись]'''.
+* 27 апреля 2021. Задачи и технологии понимания естественного языка: искусственный интеллект в помощь естественному. [https://summit.siriusconf.ru/2021 Саммит молодых ученых и инженеров «Большие вызовы для общества, государства и науки»]. Университет Сириус, Сочи. '''[[Media:Voron-2021-04-27.pdf|(PDF,&nbsp;2.2Мб)]]'''. '''[https://youtu.be/N_Yf_vNqmcA?t=73 Видеозапись]'''.
+* 8 апреля 2021. Тематическое моделирование текстовых коллекций и транзакционных данных. '''[[Media:Voron-2021-04-08.pdf|(PDF,&nbsp;9.4Мб)]]'''.
+* 31 марта 2021. Искусственный интеллект против фейков и политики постправды: типология задач и подходов. Международная конференция [https://data-fusion.ru DataFusion-2021]. '''[[Media:Voron-2021-03-31.pdf|(PDF,&nbsp;1.2Мб)]]'''. '''[https://youtu.be/y3XmFHi2OtQ?t=19727 Видеозапись]'''.
+* 19 февраля 2021. Байесовская и классическая регуляризация в вероятностном тематическом моделировании. [https://www.nsu.ru/n/mca/researchgroups/nauchno-obrazovatelnye-seminary Научно-образовательный семинар «Актуальные проблемы прикладной математики»] Новосибирского Государственного Университета. '''[[Media:Voron-2021-02-19.pdf|(PDF,&nbsp;2.3Мб)]]'''. '''[https://www.youtube.com/watch?v=MhNbccnVk5Y Видеозапись]'''.
+* 4 февраля 2021. Фейковые новости и другие типы потенциально опасного дискурса: типология, подходы, датасеты, соревнования. OpenTalks.AI. '''[[Media:Voron-2021-OpenTalksAI.pdf|(PDF,&nbsp;1.2Мб)]]'''.
+* 8 декабря 2020. Десять открытых проблем вероятностного тематического моделирования . [[Интеллектуализация обработки информации (конференция)]] '''[[Media:vorontsov-idp-2020.pdf|(PDF,&nbsp;1.2&nbsp;МБ)]]'''. '''[https://youtu.be/OWOPeptMjbI?t=1300 Видеозапись]'''.
+* 4 декабря 2020. О методологии машинного обучения. [http://hist.msu.ru/about/gen_news/rss/63131/ Исторические исследования в контексте науки о данных: информационные ресурсы, аналитические методы и цифровые технологии]. '''[[Media:Voron-2020-12-04.pdf|(PDF,&nbsp;3.9Мб)]]'''. '''[https://youtu.be/l8Yj6i0X91I?t=400 Видеозапись]'''.
+* 12 ноября 2020. Искусственный интеллект и машинное обучение. В рамках мастер-класса «Машинное обучение и искусственный интеллект в инновационных проектах, лекция и разбор кейсов участников в интерактивном режиме». Университет 2030. '''[[Media:Voron-2020-un2035.pdf|(PDF,&nbsp;2.6Мб)]]'''.
+* 23–29 августа 2020. Мини-курс «Обзор задач оптимизации в машинном обучении». [https://ssopt.org/ Традиционная Школа «Управление, информация и оптимизация»], Образовательный центр «Сириус», Сочи. Лекция 1: обучаемые модели распространения риска на графе '''[[Media:Voron-2020-ssopt-covid.pdf|(PDF,&nbsp;0.9Мб)]]'''. Лекция 2: постановки задач оптимизации в машинном обучении '''[[Media:Voron-2020-ssopt-ml.pdf|(PDF,&nbsp;1.7Мб)]]'''. Лекция 3: тематическое моделирование текстовых и транзакционных данных '''[[Media:Voron-2020-ssopt-tm.pdf|(PDF,&nbsp;3.5Мб)]]'''.
+* 3 июня 2020. Обзор постановок оптимизационных задач машинного обучения. [http://www.mathnet.ru/php/conference.phtml?confid=1794 Общероссийский семинар по оптимизации]. '''[http://www.mathnet.ru/PresentFiles/27231/voron2020_06_03_opt.pdf (PDF,&nbsp;1.9&nbsp;МБ)]'''. '''[https://youtu.be/tX_MeIbfEmw Видеозапись]'''.
+* 26 марта 2020. Методология машинного обучения: постановки оптимизационных задач. Лекция в МФТИ. '''[[Media:voron2020ml-opt.pdf|(PDF,&nbsp;1.7&nbsp;МБ)]]'''.  '''[https://drive.google.com/file/d/1erE1dNhTPGbySjNNnxEI4Zt62WlCuIRH/view Видеозапись]'''.
+* 19 марта 2020. История машинного обучения. Лекция в МФТИ. '''[[Media:voron2020ml-history.pdf|(PDF,&nbsp;5.4&nbsp;МБ)]]'''.  '''[https://drive.google.com/file/d/1bYsWrLuT5rFMwkTtDgOUGNJP-pAkSxwr/view Видеозапись]'''.
+* 26 февраля 2020. Вероятностное тематическое моделирование больших текстовых коллекций и транзакционных данных. [https://asvk.cs.msu.su/node/288 Научный семинар кафедры АСВК ВМК МГУ]. '''[[Media:voron20seminar-asvk.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''.
+* 5 декабря 2019. Моделирование и искусственный интеллект: технологии, мифы, приоритеты. [https://www2.deloitte.com/ru/ru/pages/financial-services/events/biznes-na-100.html Конференция «Бизнес на 100%: операционная эффективность»]. '''[[Media:voron19business100.pdf|(PDF,&nbsp;1.3&nbsp;МБ)]]'''.
+* 26 ноября 2019. Задачи и методы автоматического анализа текстов в разведочном информационном поиске. [[Математические методы распознавания образов (конференция)]]. '''[[Media:voron19mmpr.pdf|(PDF,&nbsp;3.8&nbsp;МБ)]]'''.
+* 24 октября 2019. [https://www.human-machine.ai «Человек и Машина» — конференция о том, как люди учат машины разговаривать и понимать смыслы]. Мастерская знаний: машина, которая ничего не понимает, но учит людей приобретать профессиональные знания '''[[Media:voron-2019-10-24-human-machine.pdf|(PDF,&nbsp;2.0&nbsp;МБ)]]'''.
+* 23 октября 2019. [https://openinnovations.ru Форум Инновационного развития], Сколково. [https://raif.jet.su RAIF 2019], секция [https://openinnovations.ru/program/session/122 Natural Language Processing и осознанный диалог: распознать, понять, ответить]. Мастерская знаний: поисково-рекомендательная система для систематизации профессионального контента '''[[Media:voron-2019-10-23-raif.pdf|(PDF,&nbsp;1.9&nbsp;МБ)]]'''.
+* 21 октября 2019. [https://mipt.ru/events/mezhpredmetnyy_seminar_ai-mipt_na_temu_-bigdata_approaches_in_genetics_and_brain_imaging_of_complex_ NORMENT (Norwegian Centre for Mental Disorders Research) seminar in MIPT], Moscow. Applications of topic modeling and non-negative matrix factorization '''[[Media:voron-2019-10-23-mipt-norment.pdf|(PDF,&nbsp;2.2&nbsp;МБ)]]'''.
+* 18 октября 2019. Открытая лекция [https://vk.com/growth.mipt AI Business Course, Физтех.Рост]. О [http://mipt.ai лаборатории машинного интеллекта МФТИ] '''[[Media:voron-2019-10-11-mil.pdf|(PDF,&nbsp;2.1&nbsp;МБ)]]'''. Тематический информационный поиск '''[[Media:voron-2019-10-18-tm-es.pdf|(PDF,&nbsp;2.7&nbsp;МБ)]]'''.
+* 11 октября 2019. Первый открытый семинар [http://mipt.ai лаборатории машинного интеллекта МФТИ]. О лаборатории '''[[Media:voron-2019-10-11-mil.pdf|(PDF,&nbsp;2.1&nbsp;МБ)]]'''. О разведочном поиске '''[[Media:voron-2019-10-11-es.pdf|(PDF,&nbsp;1.1&nbsp;МБ)]]'''. О тематическом моделировании '''[[Media:voron-2019-10-11-tm.pdf|(PDF,&nbsp;0.8&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=_rJmTI8toBQ Видеозапись]'''.
+* 11 октября 2019. Искусственный интеллект и машинное обучение. Лекция в Высшей школе системного инжиниринга МФТИ. '''[[Media:voron-2019-10-11-mipt.pdf|(PDF,&nbsp;3.7&nbsp;МБ)]]'''.
+* 28 сентября 2019. Искусственный интеллект и анализ данных – профессия будущего. [http://foresight.itteachers.ru Форсайт-сессия учителей информатики «Взгляд в будущее»] '''[[Media:voron-2019-09-28-temocenter-intro.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''. Примеры занятий по машинному обучению со школьниками: о тестах Бонгарда '''[[Media:voron-2019-09-28-temocenter-bongard.pdf|(PDF,&nbsp;1.0&nbsp;МБ)]]'''; кружок для школьников в МФТИ '''[[Media:voron-2019-09-28-temocenter-ecg.pdf|(PDF,&nbsp;3.0&nbsp;МБ)]]'''; отчёт по проекту в Сочи.Сириус '''[[Media:voron-2019-09-28-temocenter-sirius.pdf|(PDF,&nbsp;1.0&nbsp;МБ)]]'''.
+* 20 сентября 2019. Тематические векторные представления текста и разведочный информационный поиск. [http://www.mathnet.ru/php/conference.phtml?option_lang=rus&eventID=31&confid=965 Математический кружок школы ПМИ МФТИ]. '''[[Media:voron-2019-09-20-mipt.pdf|(PDF,&nbsp;2.9&nbsp;МБ)]]'''.
+* 19 сентября 2019. Искусственный интеллект на пальцах. [http://legalai.ru Искусственный интеллект в юридической практике]. '''[[Media:voron-2019-09-19-legalai.pdf|(PDF,&nbsp;1.9&nbsp;МБ)]]'''. '''[https://youtu.be/fYG5TJ2-A4I?t=30 Видеозапись]'''
+* 11 июля 2019. От AI-хайпа к ML-технологиям. [https://ostrov.2035.university Образовательный интенсив «Остров 10-22»]. '''[[Media:voron-2019-07-11-ostrov.pdf|(PDF,&nbsp;2.6&nbsp;МБ)]]'''.
+* 24 июня 2019. Искусственный интеллект и машинное обучение. Лекция в Высшей школе системного инжиниринга МФТИ. '''[[Media:voron-2019-06-24-mipt.pdf|(PDF,&nbsp;3.7&nbsp;МБ)]]'''.
+* 11 мая 2019. BigARTM: от лего-конструктора тематических моделей к сервисам разведочного поиска. [http://datafest.ru DataFest-6]. '''[[Media:voron-2019-05-11-bigartm.pdf|(PDF,&nbsp;3.1&nbsp;МБ)]]'''. '''[https://youtu.be/jsiHaJwi40s?t=16971 Видеозапись]'''.
+* 16 апреля 2019. Тематические векторные представления текста: от «мешка слов» к моделям связного текста. [https://skroboforum.sk.ru Сколково.Роботикс]. '''[[Media:vorontsov-SkRobotics-2019.pdf|(PDF,&nbsp;3.3&nbsp;МБ)]]'''.
+* 4 февраля 2019. Машинный интеллект и умный информационный поиск. [https://mipt.ru/landing_pages/magistr/iprofi/ai.html Зимняя школа МФТИ по искусственному интеллекту]. '''[[Media:vorontsov-mipt-winter-school-2019.pdf|(PDF,&nbsp;3.1&nbsp;МБ)]]'''.
+* 31 октября 2018. Data Science: как наладить взаимодействие науки, бизнеса и образования. [https://events.sap.com/ru/data-halloween/ru/home Data Halloween —– конференция про возможности Data Science для бизнеса]. '''[[Media:vorontsov-sap-2018.pdf|(PDF,&nbsp;1.5&nbsp;МБ)]]'''.
+* 24 октября 2018. Машинное обучение для анализа текстов и сложно структурированных данных. О проектах лаборатории машинного интеллекта МФТИ. Вебинар в рамках подготовки к студенческой одимпиаде «Я профессионал». '''[[Media:vorontsov-yaprofi-2018.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''.  '''[https://www.youtube.com/watch?v=LdmVJyaoOG4 Видеозапись]'''.
+* 23 октября 2018. Тематические векторные представления текстов, графов и транзакционных данных. [https://raif.jet.su/forum/ RAIF-2018: Russian Artificial Intelligence Forum] '''[[Media:vorontsov-raif-2018.pdf|(PDF,&nbsp;3.2&nbsp;МБ)]]'''.
+* 22 октября 2018. Тематические векторные представления текстов, графов и транзакционных данных. [http://orm.io.cs.msu.ru/ IX Московская международная конференция по Исследованию Операций (ORM-2018 Germeyer-100)] '''[[Media:vorontsov-corm-2018.pdf|(PDF,&nbsp;3.4&nbsp;МБ)]]'''. '''[http://www.mathnet.ru/php/presentation.phtml?option_lang=eng&presentid=22031 Видеозапись]'''.
+* 8 октября 2018. Тематические векторные представления текстов, графов и транзакционных данных. [[Интеллектуализация обработки информации (конференция)/2018]] '''[[Media:vorontsov-idp-2018.pdf|(PDF,&nbsp;3.7&nbsp;МБ)]]'''.
+* 28 сентября 2018. Технологии машинного обучения и обработки естественного языка для LegalTech. [http://legaltechexpert.ru/institute/2018/2 Программа «LegalTech директор»] '''[[Media:vorontsov-2018-legaltech-director.pdf|(PDF,&nbsp;2.2&nbsp;МБ)]]'''.
+* 15 сентября 2018. Визуализация в информационном поиске. [https://f-cc.org/vtlab Первая открытая лаборатория визуального мышления]. МФТИ. '''[[Media:voron-2018-09-15-vtlab.pdf|(PDF,&nbsp;6.3&nbsp;МБ)]]'''.
+* 11–12 июня 2018. Вероятностное тематическое моделирование: опыт построения прикладной теории. [https://sites.google.com/site/traditionalschool/ Традиционная Школа «Управление, информация и оптимизация»]. '''[[Media:Voron-2018-school-X.pdf|(PDF,&nbsp;8.5Мб)]]'''.
+* 22 мая 2018. Области использования машинного интеллекта. [http://school.soc-phys.ipu.ru Школа-семинар для молодых ученых «Основы социоинженерии»]. ИПУ РАН. '''[[Media:voron-2018-05-22-ipu.pdf|(PDF,&nbsp;2.5&nbsp;МБ)]]'''.  '''[https://www.youtube.com/watch?v=S-RLBXpDeho Видеозапись]'''.
+* 18 мая 2018. The Problems, Methods and Limitations of Machine Intelligence: Mining Texts, Graphs and Hypergraphs. [http://ctqi.tilda.ws Cognitive Technologies and Quantum Intelligence Conference]. Saint Petersburg. '''[[Media:voron-2018-05-18-ctqi.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''.
+* 28 апреля 2018. Наука и бизнес в одном FLACONе: возгонка цифровой экономики. [http://datafest.ru DataFest-5]. '''[[Media:voron-2018-04-28-keynote.pdf|(PDF,&nbsp;1.2&nbsp;МБ)]]'''. '''[https://youtu.be/gFKHZXhFs48?t=1500 Видеозапись]'''.
+* 28 апреля 2018. Тематическое моделирование в BigARTM: новые возможности. [http://datafest.ru DataFest-5]. '''[[Media:voron-2018-04-28-bigartm.pdf|(PDF,&nbsp;5.9&nbsp;МБ)]]'''. '''[https://youtu.be/3Lxb-DqPtv4?t=6309 Видеозапись]'''.
+* 8 февраря 2018. Обработка естественного языка и понимание речи. [http://opentalks.ai Открытая конференция по искусственному интеллекту OpenTalks.AI-2018]. '''[[Media:voron-2018-02-08.pdf|(PDF,&nbsp;1.1&nbsp;МБ)]]'''.
+* 29 января 2018. Математические методы и прикладные задачи анализа текстов. [https://magistr.mipt.ru/ Зимняя физико-математическая школа МФТИ «Абсолютное будущее»]. '''[[Media:voron-2018-01-29.pdf|(PDF,&nbsp;2.1&nbsp;МБ)]]'''.
+* 23 января 2018. Машинное обучение в LegalTech: задачи, возможности, ограничения. [https://www.spiba.ru/ru/event/iskusstvennyj-intellekt-mechta-i-ili-koshmar-yurista/ Искусственный интеллект – мечта и/или кошмар юриста]. Семинар Санкт-Петербургской Международной Бизнес-Ассоциации (СПИБА). '''[[Media:voron-2018-01-23.pdf|(PDF,&nbsp;2.0&nbsp;МБ)]]'''.
+* 18 декабря 2017. Towards Interpretable Word Embeddings through Probabilistic Topic Modeling. [http://ai_forum.tilda.ws/ Korean-Russian Artificial Intelligence Workshop]. '''[[Media:voron-2017-12-18.pdf|(PDF,&nbsp;1.9&nbsp;МБ)]]'''.
+* 9 ноября 2017. Fast and Modular Regularized Topic Modeling. [http://fruct.org/conference21 The seminar on Intelligence, Social Media and Web (ISMW), Open Innovations Association FRUCT (Finnish-Russian University Cooperation in Telecommunications)]. Helsinki, Finland. '''[[Media:voron-2017-11-09.pdf|(PDF,&nbsp;1.5&nbsp;МБ)]]'''.
+* 4 ноября 2017. Введение в машинное обучение. [http://deepmipt.github.io/dlschl Школа глубокого обучения — кружок для старшеклассников], МФТИ. '''[[Media:voron17deepmipt-dlschl.pdf|(PDF,&nbsp;2.6&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=xg96a8UwBac Видеозапись]'''.
+* 16 октября 2017. Машинное обучение: шаг в цифровую экономику. [http://mipt.ru/education/departments/fpmi/news/ai_mipt AI@MIPT — открытый семинар по искусственному интеллекту в МФТИ]. '''[[Media:voron17ai-mipt.pdf|(PDF,&nbsp;4.4&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=H5waFQ1ARF8 Видеозапись]'''.
+* 10 октября 2017. Аддитивная регуляризация тематических моделей связного текста. [[Математические методы распознавания образов (конференция)]]. '''[[Media:voron17mmpr.pdf|(PDF,&nbsp;2.0&nbsp;МБ)]]'''.
+* 8 октября 2017. [http://www.msk.festivalnauki.ru/meropriyatie-festivalya/61162/analiz-dannyh-i-mashinnyy-intellekt-professii-budushchego Анализ данных и машинный интеллект - профессии будущего]. Фестиваль науки НАУКА 0+. Лекторий «Большие данные для школьников». '''[[Media:voron-2017-10-08.pdf|(PDF,&nbsp;2.0&nbsp;МБ)]]'''.
+* 5 октября 2017. Многокритериальный тематический анализ текстовых коллекций. [https://cs.hse.ru/colloquium Коллоквиум факультета компьютерных наук НИУ ВШЭ]. '''[[Media:voron-2017-10-05.pdf|(PDF,&nbsp;2.2&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=eJzNAhsbQNI Видеозапись]'''.
+* 4 октября 2017. Проблема определения числа тем в тематических моделях. [[Методы анализа текстов (спецсеминары, К.В. Воронцов)/2017-2018 год]]. '''[https://drive.google.com/file/d/0B2cCJQ2_aOwjZ3BoNnN6T3QtY3M/view (PDF,&nbsp;0.9&nbsp;МБ)]'''
+* 1 октября 2017. Интервью в рамках [https://github.com/Yorko/mlcourse_open открытого курса машинного обучения]. '''[https://www.youtube.com/watch?v=DR3mgnEKRgI Видеозапись]'''.
+* 25 сентября 2017. Искусственный интеллект и машинное обучение: практические шаги в цифровую экономику. Расширенное заседание Совета по законодательному обеспечению развития цифровой экономики при Председателе Государственной Думы Федерального Собрания Российской Федерации. '''[[Media:voron-2017-09-25.pdf|(PDF,&nbsp;1.6&nbsp;МБ)]]'''
+* 13 сентября 2017. Additive Regularization for Topic Modeling. [https://cs.hse.ru/en/big-data/bayeslab/announcements/208831540.html Mini-Workshop: Stochastic Processes and Probabilistic Models in Machine Learning]. '''[[Media:voron-2017-09-13.pdf|(PDF,&nbsp;1.7&nbsp;МБ)]]'''. '''[https://youtu.be/Vb8OyPzwTUo?t=2591 Video]'''.
+* 26 июля 2017. Тематический анализ записей разговоров контакт-центра. '''[[Media:Voron-2017-07-26-mipt.pdf|(PDF,&nbsp;2.1Мб)]]'''. '''[https://www.youtube.com/watch?v=CuR5GlQLHwM Видеозапись]'''. Летняя школа и хакатон [http://turing.tilda.ws DeepHack.Turing], МФТИ.
+* 26 июля 2017. Лекция 1: Методы анализа данных: машинное обучение в анализе текстов. '''[[Media:Voron-2017-07-26-hse-1.pdf|(PDF,&nbsp;2.5Мб)]]'''. '''[https://youtu.be/JA9v7UCpKqw Видеозапись]'''. Лекция 2: Тематический анализ текстов. '''[[Media:Voron-2017-07-26-hse-2.pdf|(PDF,&nbsp;6.3Мб)]]'''. '''[https://youtu.be/9rfFy_FHV3s Видеозапись]'''. Летняя школа [https://miem.hse.ru/clschool «Автоматическая обработка текстов и анализ данных»], НИУ ВШЭ.
+* 17–18 июня 2017. Оптимизация и регуляризация вероятностных тематических моделей. [https://sites.google.com/site/traditionalschool/ Традиционная Школа «Управление, информация и оптимизация»]. '''[[Media:Voron-2017-06-17-school-IX.pdf|(PDF,&nbsp;1.5Мб)]]'''. '''[[Media:Voron-2017-06-18-school-IX.pdf|(PDF,&nbsp;2.8Мб)]]'''. Машинное обучение, искусственный интеллекти экономика будущего '''[[Media:Voron-2017-06-19-school-IX.pdf|(PDF,&nbsp;2.5Мб)]].
+* 15 июня 2017. Статистические тесты для проверки однородности и воспроизводимости электрокардиосигналов. Конференция [http://www.vniim.ru/175-year.html 175 лет ВНИИМ]. '''[[Media:voron2017vniim175.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''.
+* 1 июня 2017. Тематический анализ текстов и технология BigARTM. Лекция в [http://newprolab.com/ru/bigdata NewProLab]. '''[[Media:voron2017newprolab.pdf|(PDF,&nbsp;5.5&nbsp;МБ)]]'''.
+* 4 мая 2017. История машинного обучения. Лекция в МФТИ. '''[[Media:voron2017ml-history.pdf|(PDF,&nbsp;5.1&nbsp;МБ)]]'''.  '''[https://drive.google.com/file/d/0By4IPE_Y0aO6NDFvbVlnMEY2S3M/view Видеозапись]'''.
+* 13 марта 2017. Технология информационного анализа электрокардиосигналов. «Гаджеты в медицине: перспективы использования, новые функции, техническое совершенствование, производство и финансирование». МГТУ имени Н.Э.Баумана. '''[[Media:voron-2017-03-13.pdf|(PDF,&nbsp;2.1&nbsp;МБ)]]'''.
+* 17 февраля 2017. Машинное обучение, искусственный интеллект и экономика будущего. '''[[Media:voron-2017-02-17.pdf|(PDF,&nbsp;1.2&nbsp;МБ)]]'''.
+* 17 ноября 2016. Машинное обучение и анализ данных. Научный семинар ВНИИА. '''[[Media:voron-2016-11-17.pdf|(PDF,&nbsp;1.4&nbsp;МБ)]]'''.
+* 12 ноября 2016. Тематическое моделирование структуры расходов клиентов банка. [https://sdsj.ru/day.html Data Science Day]. '''[[Media:voron-2016-sberbank-dsd.pdf|(PDF,&nbsp;2.9&nbsp;МБ)]]'''. '''[https://youtu.be/0q5p7xP4cdA?t=15168 Видеозапись]'''.
+* 11 ноября 2016. Теория, алгоритмы и приложения вероятностного тематического моделирования. [http://www.mathnet.ru/php/seminars.phtml?option_lang=rus&presentid=15330 Математический кружок школы ФПМИ МФТИ]. '''[[Media:voron-2016-mipt-school.pdf|(PDF,&nbsp;3.6&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=ME9DK-Nrj8Q Видеозапись]'''.
+* 26 октября 2016. Матричные разложения в задачах семантического анализа текстов. Семинар  отдела «Математическое моделирование экономических систем», ВЦ РАН, Москва. '''[[Media:voron-2016-10-26.pdf|(PDF,&nbsp;1.4&nbsp;МБ)]]'''.
+* 13 октября 2016. Additive Regularization for Topic Modeling Mining Ethnical Discourse in Social Media [[Intelligent Data Processing: Theory and Applications/2016|ИОИ-2016]]. '''[[Media:voron-2016-10-13.pdf|(PDF,&nbsp;1.2&nbsp;МБ)]]'''
+* 10 октября 2016. Речь на открытии конференции [[Intelligent Data Processing: Theory and Applications/2016|ИОИ-2016]]. '''[[Media:voron-2016-10-10.pdf|(PDF,&nbsp;0.5&nbsp;МБ)]]'''.
+* 4 октября 2016. Аддитивная регуляризация наивного байесовского классификатора. Девятая международная конференция «Управление развитием крупномасштабных систем» (MLSD’2016). ИПУ РАН, Москва. '''[[Media:voron-2016-10-04.pdf|(PDF,&nbsp;1.7&nbsp;МБ)]]'''.
+* 30 сентября 2016. Тематическое моделирование. Научный семинар ФКН НИУ ВШЭ. '''[[Media:voron-2016-09-30.pdf|(PDF,&nbsp;5.8&nbsp;МБ)]]'''.
+* 13 сентября 2016. Тематическое моделирование для поиска и систематизации научно-технической информации. Семинар «Информационные технологии в современной библиотеке». '''[[Media:voron-2016-09-13.pdf|(PDF,&nbsp;5.2&nbsp;МБ)]]'''.
+* 10 сентября 2016. Тематическое моделирование на пути к разведочному информационному поиску. [http://datafest.ru Data Fest #3]. '''[[Media:voron-2016-datafest.pdf|(PDF,&nbsp;4.5&nbsp;МБ)]]'''. '''[https://www.youtube.com/watch?v=frLW8UVp_Ik Видеозапись]'''.
+* 1–24 июля 2016. Проект «Медицинская диагностика по ЭКГ» и лекции по машинному обучению. [[Извлекаем пользу из Big Data (Проектная смена, СочиСириус, 2016)]].
+* 19 мая 2016. История машинного обучения. Лекция в МФТИ. '''[[Media:voron2016ml-history.pdf|(PDF,&nbsp;4.2&nbsp;МБ)]]'''.
+* 1 февраля 2016. Regularization of Topiс Models for Question Answering. [http://qa.deephack.me А 24/7 hackathon on Question Answering systems (solving The Allen AI Science Challenge)]. '''[[Media:voron-2016-qa.pdf|(PDF,&nbsp;2.2&nbsp;МБ)]]'''. '''[http://www.youtube.com/watch?v=lM2-Mi-2egM Video]'''.
+* 9 декабря 2015. Модели и методы интеллектуального анализа данных. [http://ccas.ru Международная научная конференция по информатике и прикладной математике, посвященная 60-летию Вычислительного центра им. А. А. Дородницына РАН]. '''[[Media:voron2015ccas.pdf|(PDF,&nbsp;1.2&nbsp;МБ)]]'''.
+* 14 ноября 2015. Topic modeling as a key technology for exploratory search and social media mining. [http://ainlfruct.com Artificial Intelligence and Natural Language & Information Extraction, Social Media and Web Search FRUCT Conference]. '''[[Media:voron-2015-ainl.pdf|(PDF,&nbsp;6.0&nbsp;МБ)]]'''.
+* 14 октября 2015. BigARTM: Open Source Library for Topic Modeling of Large Text Collections. [http://www.damdid2015.iate.obninsk.ru Аналитика и управление данными в областях с интенсивным использованием данных DAMDID/RCDL]. '''[[Media:voron-2015-damdid.pdf|(PDF,&nbsp;5.6&nbsp;МБ)]]'''.
+* 7 октября 2015. Additive Regularization of Topic Models: Towards Exploratory Search and Other Multi-Criteria Applications. [https://yandexdataschool.com/conference 2nd Yandex School of Data Analysis Conference. Machine Learning: Prospects and Applications]. '''[[Media:voron-2015-yandex-mlpa.pdf|(PDF,&nbsp;6.4&nbsp;МБ)]]'''.
+* 20 сентября 2015. Регуляризация тематических моделей в библиотеке с открытым кодом BigARTM: технологическая основа разведочного информационного поиска. [http://mmro.ru Математические методы распознавания образов, ММРО-17]]. '''[[Media:mmpr17-vorontsov.pdf|(PDF,&nbsp;6.2&nbsp;МБ)]]'''.
+* 12 сентября 2015. BigARTM: тематическое моделирование больших текстовых коллекций. [http://www.meetup.com/Moscow-Data-Fest/events/224856462/ Data Fest #1]. '''[[Media:voron-2015-datafest.pdf|(PDF,&nbsp;6.5&nbsp;МБ)]]'''.
+* 25 августа 2015. Regularized Matrix Factorization for Topic Modeling of Text Collections. [http://matrix.inm.ras.ru/mmma-2015/ 4th International Conference on Matrix Methods in Mathematics and Applications MMMA-2015, August 24-28, Moscow]. '''[[Media:voron-2015-mmma.pdf|(PDF,&nbsp;6.4&nbsp;МБ)]]'''.
+* 18–21 августа 2015. Теория и практика обучения машин. [http://combalg.ru/schools/summer15 Летняя Школа «Комбинаторика и алгоритмы для школьников»]. Лекция 1. Задачи и алгоритмы классификации ([[Media:Voron-2015-08-18-lksh.pdf|Презентация, 4.4Мб]], [[Media:Voron-2015-08-18-lksh-data.rar|Данные конкурсного задания, 100Kб]]). Лекция 2. Метрические алгоритмы классификации ([[Media:Voron-2015-08-19-lksh.pdf|Презентация, 3.1Мб]]). Лекция 3. Линейные классификаторы и бустинг ([[Media:Voron-2015-08-21-lksh.pdf|Презентация, 0.4Мб]]).
+* 19 июня 2015. Аддитивно регуляризованные тематические модели и разведочный поиск знаний в сети. [https://sites.google.com/site/traditionalschool/ Традиционная Школа «Управление, информация и оптимизация»]. [[Media:Voron-2015-06-19-school-VII.pdf|Презентация, 6.3Мб]]. '''[http://www.youtube.com/watch?v=vSzsuq7uHPE Видеозапись]'''.
+* 17 июня 2015. Обучение наивного Байеса. [https://sites.google.com/site/traditionalschool/ Традиционная Школа «Управление, информация и оптимизация»]. [[Media:Voron-2015-06-17-school-VII.pdf|Презентация, 2.1Мб]]. [[Media:School-VII-2015-contest-Vorontsov.rar|Данные для конкурсного задания]].  '''[http://www.youtube.com/watch?v=Z_ri1U9Vwi0 Видеозапись]'''.
+* 29, 30 июня 2015. Automatic filtering of Russian scientific content using Machine Learning and Topic Modeling. [http://www.dialog-21.ru International Conference on Computational Linguistics Dialogue 2015, May 27-30, Moscow]. '''[[Media:voron-2015-dialog.pdf|(PDF,&nbsp;6.2&nbsp;МБ)]]'''.
+* 14 мая 2015. Multicriteria Regularization for Probabilistic Topic Modeling of Large Text Collections. Доклад на [https://sites.google.com/site/polconf Optimization and Applications in Control and Data Science (on the occasion of Boris Polyak's 80th birthday)]. '''[[Media:Voron-2015-Polyak80.pdf|(PDF,&nbsp;2.4&nbsp;МБ)]]'''. '''[http://www.mathnet.ru/php/presentation.phtml?option_lang=eng&presentid=11906 Video]'''.
+* 9 апреля 2015. BigARTM: Open Source Library for Regularized Multimodal Topic Modeling of Large Collections. Доклад на [http://aistconf.org/2015 AIST-2015]. '''[[Media:Voron-2015-AIST.pdf|(PDF,&nbsp;2.3&nbsp;МБ)]]'''.
+* 14 марта 2015. Применение машинного обучения и вычислительной лингвистики для диагностики заболеваний по электрокардиограмме. Лекция для школьников, [https://academy.yandex.ru/events/m Малый ШАД]. '''[[Media:Voron-2015-03-14-ecg.pdf|(PDF, 2.3Мб)]]'''. '''[https://www.youtube.com/watch?v=rRe5KKx4mtE Видеозапись]'''.
+* 15 декабря 2014. Machine Learning for Big Data: Texts, Signals, Images and Video. Российско-американский исследовательский симпозиум. При поддержке MIT и в сотрудничестве со Сколковским институтом науки и технологий, «Цифровой Октябрь», Москва, Россия. '''[[Media:Voron-2014-12-15-sk.pdf|(PDF, 2.4Мб)]]'''.
+* 20 октября 2014. Статистическая проверка технологии информационного анализа электрокардиосигналов для диагностики заболеваний внутренних органов. Доклад на конференции [http://icmbb.impb.ru/ru Математическая биология и биоинформатика], Пущино. '''[[Media:Voron-2014-10-20-ecg.pdf|(PDF, 2.4Мб)]]'''.
+* 6 октября 2014. Многокритериальные и многомодальные вероятностные тематические модели коллекций текстовых документов. Доклад на конференции [[Интеллектуализация обработки информации (конференция)/2014|ИОИ-2014]], Крит. [[Media:Vorontsov2014iip.pdf|(PDF, 2Мб)]].
+* 12 сентября 2014. Задача диагностики многих заболеваний по одной электрокардиограмме. Семинар по машинному обучению ВМК МГУ. '''[[Media:Voron-2014-09-12-mmp-ecg.pdf|(PDF, 1.6Мб)]]'''.
+* 11 сентября 2014. Information function of the heart: Discrete and fuzzy encoding of the ECG-signal for multidisease diagnostic system. [http://vniim.ru/amctm2014.htm International Conference Advanced Mathematical and Computational Tools in Metrology and Testing (AMCTM 2014)]. '''[[Media:Voron-2014-09-11-amctm-eng.pdf|(PDF, 1.4Мб)]]'''.
+* 11 сентября 2014. Вероятностное тематическое моделирование. Семинар в лаборатории ЛИНИС НИУ ВШЭ, Санкт-Петербург. '''[[Media:Voron-2014-09-11-tm.pdf|(PDF,&nbsp;1.5&nbsp;МБ)]]'''.
+* 21–24 августа 2014. Теория и практика обучения машин. [http://combalg.ru/schools/summer14 Летняя Школа «Комбинаторика и алгоритмы для школьников»]. Лекция 1. Задача диагностики заболеваний по электрокардиограмме ([[Media:Voron-2014-08-21-lksh.pdf|Презентация, 1.6Мб]]).  [[Media:School-VI-2014-task-3.rar|Данные для конкурсного задания]].  Лекция 2. Методы классификации и регрессии ([[Media:Voron-2014-08-22-lksh.pdf|Презентация, 3Мб]]). Лекция 3. Комбинаторная теория переобучения ([[Media:Voron-2014-08-24-lksh.pdf|Презентация, 2Мб]])
+* 27 июня 2014. Матричные разложения и вероятностное тематическое моделирование текстовых коллекций. [https://sites.google.com/site/traditionalschool/ Традиционная Школа «Управление, информация и оптимизация»]. [[Media:Voron-2014-06-27-school-VI.pdf|Презентация, 3.4Мб]].
+* 26 июня 2014. Методы статистического обучения и задача диагностики заболеваний по электрокардиограмме. [https://sites.google.com/site/traditionalschool/ Традиционная Школа «Управление, информация и оптимизация»]. [[Media:Voron-2014-06-26-school-VI.pdf|Презентация, 1.8Мб]]. [[Media:School-VI-2014-task-3.rar|Данные для конкурсного задания]].
+* 5 июня 2014. Multi-criteria regularization for Probabilistic Latent Semantic Analysis. [http://www.dialog-21.ru International Conference on Computational Linguistics Dialogue 2014, June 4-8, Bekasovo]. '''[[Media:voron-5june2014.pdf|(PDF,&nbsp;4.2&nbsp;МБ)]]'''.
+* 15 мая 2014. Additive Regularization for Probabilistic Topic Modeling. [http://premolab.ru/event/advances-optimization-and-statistics Advances in Optimization and Statistics]. '''[[Media:voron-15may2014.pdf|(PDF,&nbsp;1.9&nbsp;МБ)]]'''.
+* 19 апреля 2014. Многокритериальная регуляризация вероятностных тематических моделей коллекций текстовых документов. Семинар в НМУ. '''[[Media:voron-19apr2014.pdf|(PDF,&nbsp;1.9&nbsp;МБ)]]'''.  '''[http://www.mathnet.ru/php/presentation.phtml?option_lang=rus&presentid=8980 Видеозапись]'''.
+* 12 апреля 2014. Аддитивная регуляризация матричных разложений для вероятностного тематического моделирования. Конференция АИСТ-2014. '''[[Media:voron-12apr2014.pdf|(PDF,&nbsp;3.6&nbsp;МБ)]]'''.
+* 21 марта 2014. Вероятностные тематические модели без интегралов и распределений Дирихле. '''[[Media:voron-21mar2014.pdf|(PDF,&nbsp;3.8&nbsp;МБ)]]'''.
+* 25 февраля 2014. О некоторых задачах и методах интеллектуального анализа данных. В цикле лекций «Современных проблем прикладной математики» для студентов 2 курса ФУПМ МФТИ. '''[[Media:voron-02feb2014-mipt.pdf|(PDF,&nbsp;3.1&nbsp;МБ)]]'''.
+* 31 октября 2013. Аддитивная регуляризация вероятностных тематических моделей. Доклад на семинаре [[Спецсеминар "Байесовские методы машинного обучения"|БММО-2013]], ВМК МГУ. '''[[Media:voron13bmmo-talk.pdf|(PDF,&nbsp;1.6&nbsp;МБ)]]'''.
+* 7 октября 2013. Аддитивная регуляризация вероятностных тематических моделей. Доклад на конференции [[ММРО|ММРО-16]], Казань. '''[[Media:voron13mmro-talk.pdf|(PDF,&nbsp;1.1&nbsp;МБ)]]'''.
+* 2 октября 2013. Combinatorial theory of overfitting. How Connectivity and Splitting Reduces the Local Complexity [http://aiai2013.cut.ac.cy/measures-of-complexity-symposium Measures of Complexity Symposium] '''[[Медиа:Voron13aiai-talk.pdf|(PDF,&nbsp;1.7&nbsp;MБ)]]'''.
+* 27 сентября 2013. Combinatorial theory of overfitting. [http://shad.yandex.ru/conference The Yandex School of Data Analysis conference] '''[[Медиа:Voron13ysda-talk.pdf|(PDF,&nbsp;1.7&nbsp;MБ)]]''', '''[http://shad.yandex.ru/conference/vorontsov.xml Аннотация и видеозапись]'''.
+* 28 июня 2013. Combinatorial theory of overfitting. International Workshop on Statistical Learning [http://www.stat.iitp.ru IWSL] '''[[Медиа:Voron13iwsl-talk.pdf|(PDF,&nbsp;1.5&nbsp;MБ)]]'''.
+* 23 апреля 2013. Вероятностные тематические модели коллекций текстовых документов. Доклад на семинаре в [http://www2.viniti.ru ВИНИТИ РАН]. '''[[Media:voron-viniti-23apr2013.pdf|(PDF,&nbsp;2.0&nbsp;МБ)]]'''.
+* 13 апреля 2013. Комбинаторная теория переобучения. Семинар в НМУ. '''[[Media:Vorontsov-13apr2013.pdf|(PDF,&nbsp;3.5&nbsp;МБ)]]'''. '''Дополнение:''' ''Евгений Соколов''. Линейные классификаторы и случайные блуждания.  '''[[Media:Sokolov-13apr2013.pdf|(PDF,&nbsp;380&nbsp;KБ)]]'''
+* 26 февраля 2013. Вероятностные тематические модели коллекций текстовых документов. Просеминар кафедры [[ММП]], Москва, МГУ. '''[[Media:Vorontsov-26feb2013.pdf|(PDF,&nbsp;0.8&nbsp;МБ)]]'''.
+* 26 сентября, 3 октября 2012. Четыре лекции по машинному обучению. Высшая Школа Экономики. '''[[Media:slides-4lectures-HSE.pdf|(PDF,&nbsp;2.9&nbsp;МБ)]]'''.
+* 17 сентября 2012. Регуляризация, робастность и разреженность вероятностных тематических моделей. Доклад на конференции [[ИОИ]]-9. '''[[Media:voron-iip9-talk.pdf|(PDF,&nbsp;0.9&nbsp;МБ)]]'''.
+* 24 мая 2012. Комбинаторная теория переобучения и её применения. Семинар лаборатории PreMoLab, Москва, ИППИ РАН. '''[[Media:Vorontsov-24may2012.pdf|(PDF,&nbsp;3.0&nbsp;МБ)]]'''.
+* 27 февраля 2012. Комбинаторная теория переобучения и её применения. Просеминар кафедры [[ММП]], Москва, МГУ. '''[[Media:Vorontsov-27feb2012.pdf|(PDF,&nbsp;2.5&nbsp;МБ)]]'''.
+* 19 октября 2011. Задачи анализа данных ДНК-микрочипов. Доклад на семинаре «Время, хаос и математические проблемы» (руководитель академик В.А.Садовничий), Москва, МГУ. '''[[Media:Tonevitskiy-Vorontsov-19oct2011.pdf|(PDF,&nbsp;3&nbsp;МБ)]]'''.
+* 12 сентября 2011. Комбинаторная теория переобучения и поиск логических закономерностей. Доклад на конференции [[ММРО|ММРО-15]], Петрозаводск. '''[[Media:voron11mmro-talk.pdf|(PDF,&nbsp;1.4&nbsp;МБ)]]'''.
 * 27,29 июня 2011. Recent Advances on Generalization Bounds. '''Tutorial.''' International conference [http://premi11.hse.ru PReMI-2011] '''[[Медиа:Voron11premi-talk-1.pdf|Part&nbsp;1 (PDF,&nbsp;1.0&nbsp;MБ)]]''', '''[[Медиа:Voron11premi-talk-2.pdf|Part&nbsp;2 (PDF,&nbsp;1.5&nbsp;MБ)]]'''. Tight Combinatorial Generalization Bounds for Threshold Conjunction Rules '''[[Медиа:Voron11premi-talk-3.pdf|(PDF,&nbsp;0.6&nbsp;MБ, на&nbsp;английском)]]'''.
-* 12 января 2011. Интеллектуальный анализ данных и объектно-ориентированное программирование. Лекция на [http://fivt.fizteh.ru/zksh/2011 Зимней компьютерной школе 2011], МФТИ. '''[[Media:voron11mipt-talk.pdf|(PDF,&nbsp;960&nbsp;КБ)]]'''.
+* 12 января 2011. Интеллектуальный анализ данных и объектно-ориентированное программирование. Лекция на [http://fivt.fizteh.ru/zksh/2011 Зимней компьютерной школе 2011], МФТИ. '''[[Media:voron11mipt-talk.pdf|(PDF,&nbsp;1.0&nbsp;МБ)]]'''.
 * 7 ноября 2010. Generalization bounds based on the splitting and connectivity properties of a set of classifiers. International conference [[Распознавание образов и анализ изображений: новые информационные технологии (конференция)|PRIA-10]] '''[[Медиа:Voron10pria-talk.pdf|(PDF,&nbsp;1.4&nbsp;MБ, на&nbsp;английском)]]'''.
 * 20 октября 2010. Точные комбинаторные оценки обобщающей способности онлайнового обучения. Конференция [[Интеллектуализация обработки информации (конференция)|ИОИ-8]] '''[[Медиа:VoronReshetnyak10iip8.pdf|(PDF,&nbsp;400&nbsp;KБ)]]'''.
@@ Строка 71: / Строка 323: @@
 * 22 сентября 2009. Комбинаторный подход к проблеме переобучения. Доклад на конференции [[ММРО|ММРО-14]], Суздаль. '''[[Media:voron09mmro-talk.pdf|(PDF,&nbsp;1106&nbsp;КБ)]]'''.
 * 27 июля 2009. Методы машинного обучения, основанные на индукции правил (логические методы классификации). Доклад на семинаре [http://www.iis.nsk.su/news/conferences/20090303_elsewhere/index_e.shtml Знания и онтологии ELSEWHERE], Москва, [[Высшая школа экономики|ВШЭ]]. '''[[Media:slides-Logic(elsewhere-2009).pdf|(PDF,&nbsp;1202&nbsp;КБ)]]'''.
-* 10 ноября 2008. Методы коллаборативной фильтрации и их применение. Выступление на семинаре Б.Г.Миркина, [[Высшая школа экономики|ВШЭ]]. '''[[Media:Voron-2008-11-10-cf.pdf|(PDF,&nbsp;1083&nbsp;КБ)]]'''.
+* 10 ноября 2008. Методы коллаборативной фильтрации и их применение. Выступление на семинаре Б.Г.Миркина, [[Высшая школа экономики|ВШЭ]]. '''[[Media:Voron-2008-11-10-cf.pdf|(PDF,&nbsp;1.1&nbsp;МБ)]]'''.
 * 17 сентября 2008. Пути повышения точности оценок обобщающей способности (комбинаторный подход). Пленарный доклад на международной конференции [[РОАИ|РОАИ-9-2008]], Нижний Новгород. Презентация на&nbsp;английском '''[[Media:VoronBeam-PRIA-2008(eng).pdf|(PDF,&nbsp;846&nbsp;КБ)]]''', на русском '''[[Media:VoronBeam-PRIA-2008(rus).pdf|(PDF,&nbsp;844&nbsp;КБ)]]''', тезисы доклада на&nbsp;русском '''[[Media:Vorontsov-ROAI-2008-rus.pdf|(PDF,&nbsp;243&nbsp;КБ)]]'''.
 * 17 сентября 2008. Презентация ресурса www.MachineLearning.ru в рамках международной конференции [[РОАИ|РОАИ-9-2008]], Нижний Новгород. '''[[Media:VoronBeam-PRIA-2008-ML.pdf|(PDF,&nbsp;285&nbsp;КБ, на&nbsp;английском)]]'''.
 * 13 июня 2008. [[Участник:Vokov/Вики-ресурс MachineLearning.RU: концепция и перспективы|Вики-ресурс MachineLearning.RU: концепция и перспективы]], круглый стол в рамках конференции [[ИОИ|ИОИ-2008]], Крым, Алушта. '''[[Media:VoronBeam-IOI-2008-ML.pdf|(PDF,&nbsp;198&nbsp;КБ)]]'''.
-* 12 июня 2008.  Слабая вероятностная аксиоматика, оценки надёжности эмпирических предсказаний, расслоение и различность алгоритмов.  Конференция [[ИОИ|ИОИ-2008]], Крым, Алушта. '''[[Media:VoronBeam-IOI-2008.pdf|(PDF,&nbsp;950&nbsp;КБ)]]'''
+* 12 июня 2008.  Слабая вероятностная аксиоматика, оценки надёжности эмпирических предсказаний, расслоение и различность алгоритмов.  Конференция [[ИОИ|ИОИ-2008]], Крым, Алушта. '''[[Media:VoronBeam-IOI-2008.pdf|(PDF,&nbsp;950&nbsp;КБ)]]'''.
-* 28 апреля 2008. [[Участник:Vokov/Некоторые задачи интеллектуального анализа данных (лекция)|О некоторых задачах интеллектуального анализа данных]] — одна лекция в рамках курса «Современные проблемы прикладной математики» для студентов 5 курса [[ВМиК МГУ]]. '''[[Media:VokovLectureMMP-2008.pdf|(PDF,&nbsp;764Кб)]]'''.
+* 28 апреля 2008. [[Участник:Vokov/Некоторые задачи интеллектуального анализа данных (лекция)|О некоторых задачах интеллектуального анализа данных]] — одна лекция в рамках курса «Современные проблемы прикладной математики» для студентов 5 курса [[ВМК МГУ]]. '''[[Media:VokovLectureMMP-2008.pdf|(PDF,&nbsp;764Кб)]]'''.
-* 28 апреля 2008. Ломоносовские чтения 2008. Оценки надёжности эмпирических предсказаний (комбинаторный подход). '''[[Media:VoronBeam2008-04-18.pdf|(PDF,&nbsp;804&nbsp;КБ)]]'''.
+* 28 апреля 2008. Оценки надёжности эмпирических предсказаний (комбинаторный подход). Ломоносовские чтения 2008. '''[[Media:VoronBeam2008-04-18.pdf|(PDF,&nbsp;804&nbsp;КБ)]]'''.
-* 20 august 2007. 7th Open German/Russian Workshop (OGRW-7) on Pattern Recognition and Image Understanding, Ettlingen, Germany. Combinatorial Approach to Generalization Bounds Tightening. '''[[Media:VoronBeam2007-08-20.pdf|(PDF,&nbsp;1895&nbsp;KБ, на&nbsp;английском)]]'''.
+* 30 сентября 2007. Слабая вероятностная аксиоматика и надёжность эмпирических предсказаний. Конференция [[ММРО]]-13. '''[[Media:Voron-2013-mmro.pdf|(PDF,&nbsp;910&nbsp;КБ)]]'''.
-* 5 ноября 2005. [[ММРО]]-12. Измерение локальной эффективной функции роста в задачах поиска логических закономерностей. '''[[Media:Voron-MMPO12-present.pdf|(PDF,&nbsp;285&nbsp;КБ)]]''', вместе с речью — '''[[Media:Voron-MMPO12-speach.pdf|(PDF,&nbsp;308&nbsp;КБ)]]'''.
+* 20 august 2007. 7th Open German/Russian Workshop (OGRW-7) on Pattern Recognition and Image Understanding, Ettlingen, Germany. Combinatorial Approach to Generalization Bounds Tightening. '''[[Media:VoronBeam2007-08-20.pdf|(PDF,&nbsp;1.9&nbsp;МБ, на&nbsp;английском)]]'''.
+* 4 июня 2006. Прикладные исследования и разработки компании Форексис в области интеллектуального анализа данных. Конференция [[ИОИ|ИОИ-2006]], Крым, Алушта. '''[[Media:Voron-2006-ioi.pdf|(PDF,&nbsp;460&nbsp;КБ)]]'''
+* 5 ноября 2005. Измерение локальной эффективной функции роста в задачах поиска логических закономерностей. Конференция [[ММРО]]-12. '''[[Media:Voron-MMPO12-present.pdf|(PDF,&nbsp;285&nbsp;КБ)]]''', вместе с речью — '''[[Media:Voron-MMPO12-speach.pdf|(PDF,&nbsp;308&nbsp;КБ)]]'''.
+* 14 июня 2004. Комбинаторный подход к оцениванию качества алгоритмов, обучаемых по прецедентам. Конференция [[ИОИ|ИОИ-2004]], Крым, Алушта. '''[[Media:Voron-2004-ioi.pdf|(PDF,&nbsp;520&nbsp;КБ)]]'''.
+* 28 ноября 2003. Комбинаторные оценки качества обучения по прецедентам. Конференция [[ММРО]]-11. '''[[Media:Voron-2003-MMPO11.pdf|(PDF,&nbsp;680&nbsp;КБ)]]'''.
 == Научные интересы==
-Всё, что скрывается за терминами «[[интеллектуальный анализ данных]]» (data mining) и «[[машинное обучение]]» (machine learning):
+Всё, что скрывается за терминами «[[науки о данных]]» (data science), «[[интеллектуальный анализ данных]]» (data mining) и «[[машинное обучение]]» (machine learning):
 [[распознавание образов]],
 [[прогнозирование]],
@@ Строка 88: / Строка 344: @@
 дискретная математика,
 [[Методы оптимизации|численные методы оптимизации]],
+[[аналитика больших данных]],
 а также практический анализ данных в разнообразных областях
-([[Приложения в экономике|экономика]],
+([[Приложения в медицине|медицина]],
-[[Приложения в медицине|медицина]],
 [[Приложения в технике|техника]],
 [[Биоинформатика|биоинформатика]],
+[[Приложения в экономике|экономика]],
+[[лингвистика]],
 [[Анализ веба|интернет]]).
+=== Анализ текстов и информационный поиск ===
+Современные средства текстового поиска предназначены для ответов на короткие текстовые запросы. Этого не достаточно при самообразовании и поиске научной информации, в особенности новой или содержащей неизвестную пользователю терминологию. Поиск и мониторинг новых тенденций, терминологии, профессиональных сообществ всё ещё требует больших затрат времени и высокой квалификации. Существует барьер входа в новую профессиональную область. Ответ на вопрос «где находится передний край науки по данной теме» по-прежнему достигается, главным образом, путём личного общения, следовательно, субъективен и не общедоступен. Наш подход к  исследовательскому поиску (Exploratory Search) основан на концепции Мастерской Знаний. Это среда для поиска, анализа и переработки больших объёмов текстовой информации. В ней пользователь «мастерит» тематические текстовые подборки. Мастерская помогает ему расширять подборку, писать по ней рефераты и обзоры, выделять ключевые понятия и факты, систематизировать по темам, строить графические визуализации в виде «карты знаний». Миссия проекта — ''убирать барьеры между человеком и знанием''. В Мастерской применяются разнообразные технологии [[Обработка естественного языка|обработки естественного языка]] (NLP).
+[[тематическое моделирование|Вероятностное тематическое моделирование]] (Probabilistic Topic Modeling) служит для выявления тематики больших текстовых коллекций и определения, к каким темам относится каждый текстовый документ. Также оно находит всё больше неожиданных применений в областях, далёких от анализа текстов: при обработке изображений и видео, звуковых и биомедицинских сигналов, нуклеотидных и аминокислотных последовательностей, пользовательских логов, финансовых и транзакционных данных.
+'''Основные направления исследований и разработок'''
+* теория и методы [[ARTM|аддитивной регуляризации тематических моделей]] (ARTM);
+* разработка [[BigARTM]] — библиотеки с открытым кодом для тематического моделирования больших коллекций;
+* разработка инструментальной среды для тематического моделирования [https://github.com/machine-intelligence-laboratory/TopicNet TopicNet];
+* разработка поисково-рекомендательной системы [https://scisearch.ai SciSearch.ai];
+* автоматическое выделения терминов-словосочетаний в текстах;
+* тематические модели последовательного текста, тематической структуры и сегментации текстов;
+* мультимодальные тематические модели, классификация и регрессия с текстовыми и разреженными признаками;
+* иерархические тематические модели и категоризация текстов;
+* [[Media:Aysina-2015-visptm.pdf|методы визуализации тематических моделей]];
+* методы автоматического именования тем;
+* проблемы сходимости и устойчивости численных методов матричных и тензорных разложений;
+* проблемы интерпретируемости тем;
+* мультиязычные тематические модели;
+* тематические модели транзакционных данных или гиперграфов;
+* анализ тональности и разделение тем на полярные мнения;
+* темпоральные (динамические) тематические модели;
+* автоматическое оценивание когнитивной сложности текста;
+'''Прикладные задачи'''
+* иерархическая тематическая модель научного и научно-популярного контента;
+* тематический исследовательский информационный поиск;
+* полуавтоматическое реферирование тематических подборок научных статей;
+* классификация и динамическая тематизация новостных потоков;
+* модели символьной динамики для анализа дискретных временных рядов;
+* тематическая кластеризация отзывов клиентов или опросов персонала;
+* классификация и сценарный анализ записей разговоров контактного центра;
+* выявления паттернов потребительского поведения клиентов по банковским транзакциям;
+* выявление видов экономической деятельности компаний по банковским транзакциям;
+'''Ключевые слова'''
+* text analysis, information retrieval, keyphrase extraction, topic modeling, probabilistic latent semantic analysis (PLSA), latent Dirichlet allocation (LDA), Gibbs sampling, documents categorization, learning to rank, research trends, research front.
+'''Материалы и задания'''
+* ''[[Media:BigARTM-short-intro.pdf|Тематический анализ больших данных]]''. Краткое популярное введение в BigARTM.
+* ''Воронцов К. В.'' [[Media:voron17survey-artm.pdf|Вероятностное тематическое моделирование: теория регуляризации ARTM и библиотека с открытым кодом BigARTM]]. {{важно|— обновление 19.05.2023}}.
+* ''[http://postnauka.ru/video/61910 Разведочный информационный поиск]''. Видеолекция на ПостНауке.
+* ''[https://postnauka.ru/faq/86373 Тематическое моделирование]''. FAQ на ПостНауке, совместно с Корпоративным университетом Сбербанка.
+* ''[https://habrahabr.ru/company/yandex/blog/313340 Тематическое моделирование на пути к разведочному информационному поиску]''. Лекция на DataFest3, 10 сентября 2016.  [https://www.youtube.com/watch?v=frLW8UVp_Ik&index=5&list=PLJOzdkh8T5kqfhWXhtYevTUHIvrylDLYu Видеозапись].
+* [[Media:voron-2016-task-PTM.pdf|Практическое задание, 2016]].
+* [[Коллекции документов для тематического моделирования]].
+=== Фейковые новости и потенциально опасный дискурс ===
+Постправда — это политика игнорирования фактов, использования фейковых новостей и приёмов пропаганды для формирования общественного мнения. Опасность постправды в том, что она навязывает социуму ложную картину мира и вынуждает людей принимать невыгодные для них решения. Блогосфера и социальные сети способствуют распространению фейков, лженаучных и мифологизированных представлений о мире. Средства массовой информации всё чаще используются для ведения информационных войн между корпорациями, государствами и идеологиями.  Создание технологий, способных противостоять некритичному восприятию постправды, становится фундаментально важной задачей. Речь идёт об использовании технологий машинного обучения и автоматической обработки текстов для выявления манипулятивных приёмов, обмана, слухов, сплетен, мистификаций, противоречий, замалчивания, мифологизации и идеологизации. Мы называем эти явления потенциально опасным дискурсом. Их необходимо не только выявлять, но и оценивать степень их опасности, и на какие целевые аудитории направлено воздействие. Исследование носит междисциплинарный характер и предполагает тесное взаимодействие с лингвистами, журналистами, политологами, психологами.
+'''Основные направления исследований и разработок''':
+* распознавание фейков в новостях;
+* распознавание пропаганды и приёмов информационной войны;
+* поиск противоречивых оценок и интерпретаций одних и тех же событий в различных источниках;
+* выявление манипулятивных приёмов в тексте;
+* классификация психоэмоциональных реакций целевых аудиторий на текстовое сообщение;
+* выявление конструктов мифологизированной/идеологизированной картины мира (мифологем/идеологем);
+* модели классификации текстов, пар текстов и фрагментов текстов по размеченным выборкам;
+* методы активного обучения для формирования неразмеченных выборок в краудсорсинге;
+* разработка открытых библиотек для выявления и анализа потенциально опасного дискурса.
+'''Материалы'''
+* [[Media:Voron-2021-OpenTalksAI.pdf|Фейковые новости и другие типы потенциально опасного дискурса: типология, подходы, датасеты, соревнования]].
+* [https://www.sciencedirect.com/science/article/abs/pii/S095741741930661X ''Estela Saquete et al.'' (2020) Fighting post-truth using natural language processing: A review and open challenges].
+=== Отслеживание контактов и оценка рисков инфицирования ===
+В условиях пандемии перед производственными предприятиями и организациями встают вопросы: какие противоэпидемиологические мероприятия провести, чтобы минимизировать потери, избежать локдауна или максимально эффективно из него выйти. Кого в первую очередь тестировать, кого отправлять на карантин, кого вакцинировать, для всех ли сотрудников масочно-перчаточный режим строго обязателен. Ответы на эти вопросы не универсальны и зависят от структуры контактов на конкретном предприятии. В проекте используются данные о контактах, предоставленные компанией [http://softtree.ru Софттри] в рамках проекта [https://amuleit.ru Amuleit], для моделирования распространения инфекции по графу контактов и сравнения эффективности различных мероприятий. Для оценивания индивидуального риска инфицирования строятся вероятностные модели по обучающим выборкам, сформированным имитационной моделью распространения инфекции по графу контактов. Оценки индивидуального риска позволяют формировать приоритетные списки людей для тестирования и вакцинации, и тем самым существенно сокращать затраты и повышать эффективность противоэпидемических мероприятий.
+'''Основные направления исследований и разработок''':
+* имитационное моделирование распространения инфекции по заданному динамическому графу контактов;
+* имитационное моделирование для генерирования динамического графа контактов;
+* вероятностные модели риска с прямым и обратным отслеживанием контактов;
+* методы инкрементного обучения вероятностной модели индивидуального риска инфицирования;
+* оценивание результативности противоэпидемиологических мероприятий с помощью имитационного моделирования.
+'''Материалы'''
+* [[Media:Voron-2020-ssopt-covid.pdf|Обучаемые модели распространения риска на графе]].
+<!--
+=== Диагностика заболеваний по ЭКГ ===
+Все знают, что по электрокардиограмме можно ставить диагнозы сердечно-сосудистых заболеваний. Профессором д.м.н. В.М.Успенским предложена [[технология информационного анализа электрокардиосигналов]], позволяющая диагностировать широкий спектр заболеваний внутренних органов по ЭКГ. Многие болезни сказываются на работе сердца задолго до проявления клинических симптомов, что позволяет использовать ЭКГ для ранней диагностики. За 15 лет применения этой технологии накоплена обучающая выборка по двадцати тысячам больных и нескольким десяткам заболеваний. Вычислительные эксперименты подтверждают, что диагностика широкого спектра заболеваний по одной ЭКГ с использованием методов машинного обучения может достигать удивительной точности. Наша научная группа занимается всесторонней статистической экспертизой этого метода диагностики и разработкой новых принципов анализа дискретизированных биомедицинских сигналов. В частности, важным направлением является применение тематического моделирования и методов компьютерной лингвистики. Фактически, речь идёт о поиске оптимальной реконструкции (восстановлении синтаксиса и семантики) языка, порождаемого протекающими в организме человека сложнейшими физиологическими процессами, и при этом несущего значимую диагностическую информацию о состоянии здоровья человека.
+'''Основные направления исследований и разработок''':
+* поиск более эффективных методов дискретизации ЭКГ-сигналов;
+* построение диагностических эталонов заболеваний методами тематического моделирования;
+* разработка диагностических моделей для отдельных заболеваний;
+* разработка специальных методов отбора признаков, глубокого обучения, многоклассовой классификации;
+* исследование переобучения диагностических моделей.
+'''Конкурсное задание на VI Традиционной молодёжной летней школе «Управление, информация и оптимизациия» 26 июня 2014г.'''
+* [[Media:Voron-2014-06-26-school-VI.pdf|Презентация на ТМШ, 26 июня 2014, 1.8Мб]].
+* [[Media:School-VI-2014-task-3.rar|Данные для задания на ТМШ 2014]].
+В архиве файлы по 1 болезни, обучающая выборка с классификациями, тестовая выборка без классификаций, read.me с условием задания.
+'''Другие материалы и задания'''
+* Информационный портал диагностической системы «Скринфакс». URL: http://skrinfax.ru
+* [[Media:Voron-2014-task-ekg-about.pdf|Презентация, 0.7Мб]].
+* [[Media:Voron-2014-task-ekg.pdf|Практическое задание]].
+* [[Media:Voron-2014-task-ekg-data.rar|Данные, 1.2Мб]].
+В архиве файлы по 5 болезням, для каждой болезни имеется два файла:
+файлы с буквой «Э» в имени — эталонные выборки с надёжно верифицированными диагнозами, которые предполагается использовать для обучения;
+файлы без буквы «Э» — контрольные выборки.
+Можно использовать только эталонные, можно пробовать их перемешивать.
+В каждом файле первый столбец содержит метки классов (0-здоров, 1-болен), следующие 216 столбцов - значения признаков.
+-->
 === Теория обобщающей способности ===
-{{main|Комбинаторная теория переобучения}}
 Проблема [[обобщающая способность|обобщающей способности]] является ключевой и в то же время наиболее сложной в машинном обучении. Её даже выделяют в отдельную дисциплину — [[Теория вычислительного обучения|теорию вычислительного обучения]].
 Если алгоритм, восстанавливающий некоторую неизвестную зависимость, построен по конечной [[обучающая выборка|обучающей выборке]] [[прецедент]]ов, то как предсказать качество его работы на контрольной выборке, состоящей из новых прецедентов?
@@ Строка 131: / Строка 498: @@
 Основная цель дальнейших исследований — доведение комбинаторной теории переобучения до уровня практической применимости.
-Основные направления дальнейших исследований:
+'''Основные направления исследований:'''
 * разработка математической техники для перехода от ненаблюдаемых оценок к наблюдаемым (возможно, как на основе комбинаторики, так и на основе теории концентрации вероятностной меры);
 * исследование комбинаторно-статистических свойств графа расслоения-связности модельных и реальных семейств алгоритмов.
@@ Строка 145: / Строка 512: @@
 * разработка методики тестирования и анализа обобщающей способности для [[Полигон алгоритмов|«Полигона алгоритмов классификации»]].
-'''Публикации:'''
+'''Материалы:'''
+* ''Воронцов К. В.'' [[Media:Voron-2011-tnop.pdf|Теория надёжности обучения по прецедентам]]. Курс лекций ВМК МГУ и МФТИ. 2011.
 * {{П:Воронцов 2010 Комбинаторная теория}}
+* [[Комбинаторная теория переобучения (виртуальный семинар)]]
-Лучшее изложение с добавлением последних результатов:
-* ''Воронцов К. В.'' [[Media:Voron-2011-tnop.pdf|Теория надёжности обучения по прецедентам]]. Курс лекций ВМК МГУ и МФТИ. 2011.
 '''Ключевые слова:'''
@@ Строка 155: / Строка 521: @@
 === Комбинаторная (перестановочная) статистика ===
-{{main|Слабая вероятностная аксиоматика}}
 Это направление логично вытекает из предыдущего и является его обобщением.
 Оказывается, многие фундаментальные факты теории вероятностей и математической статистики можно переформулировать и доказать, не опираясь на колмогоровскую аксиоматику, то есть не используя теорию меры, и даже не употребляя само понятие вероятности.
@@ Строка 176: / Строка 542: @@
 Например, отпадает необходимость введения различных типов сходимости.
-Основные направления исследований:
+'''Основные направления исследований:'''
 * выяснение границ применимости слабой вероятностной аксиоматики;
 * точные (комбинаторные) [[статистический тест|статистические тесты]];
@@ Строка 183: / Строка 549: @@
 * множественное тестирование статистических гипотез и его связь с проблемой переобучения.
-Ключевые слова:
+'''Ключевые слова:'''
 exchangeability, permutational statistics, concentration of probability measure.
-=== Алгоритмические композиции ===
+=== Прогнозирование объёмов продаж ===
-{{main|Композиция алгоритмов}}
-Алгоритмические композиции применяются в сложных задачах, когда имеющиеся [[базовый алгоритм|базовые алгоритмы]] не дают желаемого качества обучения.
-В&nbsp;таких случаях строят композиции алгоритмов, стараясь, чтобы ошибки различных алгоритмов скомпенсировали друг друга.
-Самый простой пример композиции — усреднение ответов, выдаваемых базовыми алгоритмами.
+Задачи прогнозирования объёмов продаж в сетях супермаркетов характеризуются
-Можно усреднять с весами.
+огромным количеством временных рядов,
-Можно выделять [[область компетентности|области компетентности]] различных алгоритмов, и в каждой области использовать свое распределение весов.
+фактической невозможностью использования классических ресурсоёмких методов прогнозирования,
-Можно строить композиции алгоритмов с помощью нелинейных операций.
+несимметричностью функции потерь,
-Какой из этих методов лучше?
+разнородностью и нестационарностью временных рядов,
-В&nbsp;каких задачах?
+наличием пропусков и неточностей в данных,
-Как&nbsp;обучать базовые алгоритмы, учитывая, что они будут работать не по-отдельности, а в составе композиции?
+возможностью привлечения дополнительной информации о структуре ассортимента, географии продаж, ценах, промо-акциях и поведении конкурентов.
-Можно&nbsp;ли приспособить для этого стандартные методы обучения?
-Как&nbsp;оценивать и целенаправленно улучшать обобщающую способность композиции?
-Как&nbsp;при этом сделать число алгоритмов в композиции поменьше?
-Идея алгоритмических композиций была выдвинута в середине 70-х годов в работах академика РАН [[Журавлёв, Юрий Иванович|Ю.И.Журавлева]].
+'''Основные направления исследований:'''
-В&nbsp;зарубежных исследованиях это тема стала чрезвычайно популярной в 90-е годы, после изобретения алгоритмов [[бустинг]]а, [[бэггинг]]а, [[смесь экспертов|смесей экспертов]] и других композитных конструкций.
+* адаптивные методы краткосрочного прогнозирования при несимметричной функции потерь;
+* адаптивные композиции алгоритмов прогнозирования при несимметричной функции потерь;
+* адаптивные методы прогнозирования плотности распределения;
+* адаптивные методы квантильной регрессии;
+* поиск взаимозаменяемых товаров, анализ и прогнозирование каннибализации брендов.
-Основные направления исследований:
+'''Материалы:'''
-* разработка эффективных алгоритмов построения композиций;
+* ''Видеолекция на ПостНауке:'' [http://postnauka.ru/video/59633 Математические методы прогнозирования объемов продаж].
-* повышение обобщающей способности композиций;
-* композиции [[логическая закономерность|логических закономерностей]];
-* [[монотонная коррекция]] классификаторов на основе комбинаторных оценок [[Полный скользящий контроль|полного скользящего контроля]].
-* композиции алгоритмов [[ранжирование|ранжирования]];
-* композиции алгоритмов [[прогнозирование|прогнозирования]];
-* сравнительный анализ различных методов построения композиций.
-Ключевые слова:
+'''Ключевые слова:'''
-multiple classifier systems, ensemble learning, classifier fusion, mixture of experts.
+sales forecast, density forecast, forecasting under asymmetric loss, quantile regression.
+<!---
-=== Анализ клиентских сред и коллаборативная фильтрация ===
+=== Анализ клиентских сред и коллабораций ===
 {{main|Анализ клиентских сред}}
 Анализ клиентских сред (АКС) является относительно новой и быстро развивающейся областью [[интеллектуальный анализ данных|интеллектуального анализа данных]] (data mining).
@@ Строка 231: / Строка 589: @@
 Создание математического обеспечения для них является актуальной наукоемкой задачей.
-Один из типичных примеров клиентской среды — интернет-портал, предоставляющий доступ к большому количеству ресурсов, скажем, интернет-магазин или поисковый сервер.
+Примеры клиентских сред — электронная библиотека, интернет-магазин, поисковая система.
-Технология АКС позволяет решать задачи персонализации контента — когда результаты поиска, информационные каталоги, предложения товаров и услуг, и т.д. выстраиваются в таком порядке, чтобы пользователю легче было находить информацию, необходимую именно ему, именно в данный момент.
+Технология АКС позволяет персонализировать поиск контента, ранжируя результаты поиска в таком порядке, чтобы клиенту было легче находить информацию, необходимую именно ему, именно в данный момент.
-Основные направления исследований:
+'''Основные направления исследований:'''
 * создание [[Полигон алгоритмов коллаборативной фильтрации|полигона алгоритмов коллаборативной фильтрации]];
 * разработка эффективных алгоритмов АКС и [[коллаборативная фильтрация|коллаборативной фильтрации]], позволяющих строить иерархические, разреженные, интерпретируемые профили клиентов и ресурсов в условиях динамичного потока исходных данных;
 * обобщающая способность алгоритмов матричного разложения;
-* решение задач [[персонализация|персонализации]];
+* решение прикладных задач [[персонализация|персонализации]];
 * разработка [[рекомендующая система|рекомендующих систем]].
-Ключевые слова:
+'''Ключевые слова:'''
 collaborative filtering, recommender systems, personalization, web mining, web usage mining, client relationship management, matrix factorization, probabilistic latent semantic indexing.
@@ Строка 252: / Строка 610: @@
 Однако на&nbsp;практике, как правило, ограничиваются эмпирическими оценками.
-Основные направления исследований:
+'''Основные направления исследований:'''
 * адаптивные алгоритмы классификации и прогнозирования;
 * исследование возможности переноса комбинаторной теории переобучения на случай адаптивного обучения;
@@ Строка 259: / Строка 617: @@
 * динамическая оптимизация инвестиционного портфеля;
-Ключевые слова:
+'''Ключевые слова:'''
 online learning, incremental learning, adaptive learning, reinforcement learning.
-=== Прогнозирование объёмов продаж ===
+=== Алгоритмические композиции ===
-{{main|Прогнозирование объёмов продаж}}
+{{main|Композиция алгоритмов}}
-Задачи прогнозирования объёмов продаж в сетях супермаркетов характеризуются
+Алгоритмические композиции применяются в сложных задачах, когда имеющиеся [[базовый алгоритм|базовые алгоритмы]] не дают желаемого качества обучения.
-огромным количеством временных рядов,
+В&nbsp;таких случаях строят композиции алгоритмов, стараясь, чтобы ошибки различных алгоритмов скомпенсировали друг друга.
-фактической невозможностью использования классических ресурсоёмких методов прогнозирования,
-несимметричностью функции потерь,
-разнородностью и нестационарностью временных рядов,
-наличием пропусков и неточностей в данных,
-возможностью привлечения дополнительной информации о структуре ассортимента, географии продаж, ценах, промо-акциях и поведении конкурентов.
-Основные направления исследований:
+Самый простой пример композиции — усреднение ответов, выдаваемых базовыми алгоритмами.
-* адаптивные методы краткосрочного прогнозирования при несимметричной функции потерь;
+Можно усреднять с весами.
-* адаптивные композиции алгоритмов прогнозирования при несимметричной функции потерь;
+Можно выделять [[область компетентности|области компетентности]] различных алгоритмов, и в каждой области использовать свое распределение весов.
-* адаптивные методы прогнозирования плотности распределения;
+Можно строить композиции алгоритмов с помощью нелинейных операций.
-* адаптивные методы квантильной регрессии;
+Какой из этих методов лучше?
-* поиск взаимозаменяемых товаров, анализ и прогнозирование каннибализации брендов.
+В&nbsp;каких задачах?
+Как&nbsp;обучать базовые алгоритмы, учитывая, что они будут работать не по-отдельности, а в составе композиции?
+Можно&nbsp;ли приспособить для этого стандартные методы обучения?
+Как&nbsp;оценивать и целенаправленно улучшать обобщающую способность композиции?
+Как&nbsp;при этом сделать число алгоритмов в композиции поменьше?
-Ключевые слова:
+Идея алгоритмических композиций была выдвинута в середине 70-х годов в работах академика РАН [[Журавлёв, Юрий Иванович|Ю.И.Журавлева]].
-sales forecast, density forecast, forecasting under asymmetric loss.
+В&nbsp;зарубежных исследованиях это тема стала чрезвычайно популярной в 90-е годы, после изобретения алгоритмов [[бустинг]]а, [[бэггинг]]а, [[смесь экспертов|смесей экспертов]] и других композитных конструкций.
-=== Биоинформатика ===
+'''Основные направления исследований:'''
-{{main|Биоинформатика}}
+* разработка эффективных алгоритмов построения композиций;
-Основные направления исследований:
+* повышение обобщающей способности композиций;
-* сравнение и кластеризация белков;
+* композиции [[логическая закономерность|логических закономерностей]];
-* распознавание вторичной структуры белка по первичной;
+* повышение обобщающей способности логических закономерностей и их композиций;
-* обработка данных [[ДНК-микрочип]]ов.
+* [[монотонная коррекция]] классификаторов на основе комбинаторных оценок [[Полный скользящий контроль|полного скользящего контроля]].
+* композиции алгоритмов [[ранжирование|ранжирования]];
+* композиции алгоритмов [[прогнозирование|прогнозирования]];
+* сравнительный анализ различных методов построения композиций.
-=== Другие проекты ===
+'''Ключевые слова:'''
+multiple classifier systems, ensemble learning, classifier fusion, boosting, mixture of experts, rule learning, rule induction.
+--->
+=== Другие проекты и семинары ===
+(в значительной степени устаревшие)
 * [[Полигон алгоритмов|Полигон алгоритмов классификации]]
 * [[Полигон алгоритмов коллаборативной фильтрации]]
+'''Виртуальные семинары'''
 * [[Similarity Miner (виртуальный семинар)]]
 * [[Улучшение сканированного текста (виртуальный семинар)]]
 * [[Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)]]
+* [[Расслоение и сходство алгоритмов (виртуальный семинар)]]
+* [[Анализ клиентских сред и коллаборативная фильтрация (виртуальный семинар)]]
+'''Материалы для преподавателей'''
+* [[MachineLearning:Учебный процесс]]
+* [[Преподавание машинного обучения]]
+* [[Коллекция учебных задач]]
+'''Семинары'''
+<!----* [[Проблемы обобщающей способности алгоритмов классификации, регрессии и прогнозирования (спецсеминар К. В. Воронцова, ВМК МГУ)]]--->
+* [[Методы анализа текстов (спецсеминары, К.В. Воронцов)/2017-2018 год]]
+* [[Задачи анализа данных в бизнес-аналитике (семинар К. В. Воронцова)]]
+* [[Семинар К. В. Рудакова]] — регулярный '''не виртуальный''' семинар (следите за объявлениями!)
 == Публикации ==
-'''Только неустаревшее''':
+'''Основное'''
-* ''Воронцов К. В.'' [[Media:Voron05latex.pdf|LaTeX2e в примерах]]. — 2005. — 56&nbsp;c.
+* [[Media:Voron05latex.pdf|LaTeX2e в примерах]]. — 2005. — 56&nbsp;c.
-* ''Воронцов К. В.'' [[Media:Voron-ML-1.pdf|Теория обучения машин]]. Первый семестр. Курс лекций ВМК МГУ и МФТИ. 2011.
+* [[Media:Voron-ML-1.pdf|Теория обучения машин]]. Первый семестр. Курс лекций ВМК МГУ и МФТИ.
-* ''Воронцов К. В.'' [[Media:Voron-2011-tnop.pdf|Теория надёжности обучения по прецедентам]]. Курс лекций ВМК МГУ и МФТИ. 2011.
+* [[Media:Voron-2011-tnop.pdf|Теория надёжности обучения по прецедентам]]. 2011. Курс лекций ВМК МГУ и МФТИ.
+* [[Media:voron17survey-artm.pdf|Вероятностное тематическое моделирование: теория регуляризации ARTM и библиотека с открытым кодом BigARTM]]. 2023.
-'''Всё остальное:'''
+'''Всё остальное'''
-* [http://www.ccas.ru/voron/bib-voron.html Список публикаций], более полный, но реже обновляемый.
+* [[Участник:Vokov/Публикации|Полный список публикаций]].
+* [[Участник:Vokov/Publications|Publications of Konstantin Vorontsov in English]] — список публикаций на английском языке.
-== Софт ==
+== Софт и проекты ==
-* [[ChartLib]] — [http://www.ccas.ru/voron/chartlib.html ChartLib] ([http://www.ccas.ru/frc/chartlive/intro.html документация])
+* '''[[ChartLib]] — Библиотека деловой и научной графики''' (1998-2008)
-Библиотека деловой и научной графики.
 Удобный инструмент для аналитических исследований, генерации графиков в Internet, подготовки отчетов, выполнения курсовых и дипломных работ, встраивания графиков в приложения на Delphi и C#.
 Имеет собственный формат входных данных CHD (CHart Description), позволяющий описывать как таблицы данных, так и внешний вид графика. Поддерживается более 150 команд, более 50 свойств точек графика, имеется встроенный калькулятор арифметических выражений.
 Графики могут быть выведены в окно прикладной программы, на принтер, в буфер обмена, в файлы графических форматов BMP, EMF, PNG, JPEG, GIF. Имеется программа chdView.exe для просмотра CHD-файлов.
+:Страница: [http://www.ccas.ru/voron/chartlib.html ChartLib]
+:Документация: [http://www.ccas.ru/frc/chartlive/intro.html на сайте ВЦ РАН (надо вручную переключиться на KOI8-R)]
-== Планы по развитию MachineLearning.RU ==
+* '''[[BigARTM]] — Открытая библиотека тематического моделирования''' (текущий проект)
-=== Сильно недописанные статьи ===
-*[[Интеллектуальный анализ данных]]
-*[[Решающее дерево]]
-*[[Переобучение]]
-*[[Выборка]]
-*[[Коллаборативная фильтрация]]
-*[[Прогнозирование плотности]]
-=== Немного недописанные статьи ===
-*[[Обучение с учителем]]
-*[[Машинное обучение]]
-*[[Модель зависимости]]
-*[[Алгоритм обучения]] = [[Метод обучения]]
-*[[Классификация]]
-*[[Скользящий контроль]] = [[Кросс-валидация]] = [[CV]]
-*[[Теория Вапника-Червоненкиса]]
-*[[Наивный байесовский классификатор]]
-*[[Линейный классификатор]]
-*[[Логическая закономерность]]
-*[[LaTeX]]
-*[[BibTeX]]
-=== Статьи, нуждающиеся в доработке ===
-*[[Персептрон]]
-=== Базовые понятия ===
-*[[:Категория:Машинное обучение]] и статья [[Машинное обучение]]
-*[[Обучение по прецедентам]] = [[Машинное обучение]]
-*[[Обучение с учителем]]
-*[[Обучение без учителя]]
-*[[:Категория:Классификация]]
-*[[Классификация]] = [[Дискриминантный анализ]]
-*[[Объект]] = [[Прецедент]]
-*[[Признак]]
-*[[Признаковое описание]]
-*[[Шкала измерения]]
-*[[Выборка]] = [[Обучающая выборка]]
-*[[Алгоритм обучения]] = [[Метод обучения]]
-*[[Модель алгоритмов]] = [[Модель зависимости]]
-*[[Корректный алгоритм]]
-*[[Функция потерь]]
-*[[Эмпирический риск]] = [[Минимизация эмпирического риска]] = [[ERM]]
-*[[Максимум правдоподобия]] = [[Метод максимума правдоподобия]] = [[Максимизация правдоподобия]] = [[Правдоподобие]]
-=== Статистика ===
-*[[:Категория:Прикладная статистика]]
-*[[:Категория:Статистические тесты]]
-*[[:Категория:Параметрические статистические тесты]]
-*[[:Категория:Непараметрические статистические тесты]]
-*[[Прикладная статистика]]
-*[[Проверка статистических гипотез]]
-*[[Статистика (функция выборки)]]
-*[[Статистический критерий]] = [[Статистический тест]]
-*[[Уровень значимости]] = [[Значимость]]
-*[[Нулевая гипотеза]]
-*[[P-Value]] = [[пи-величина]] = [[пи-значение]]
-*[[Квантиль]]
-*[[Критерий Стьюдента]]
-*[[Вариационный ряд]]
-*[[Критерий Уилкоксона-Манна-Уитни]] = [[Критерий Манна-Уитни]] = [[Критерий Уилкоксона]] = [[Критерий Вилкоксона]]
-*[[Критерий знаков]]
-*[[Коэффициент эксцесса]]
-*[[Коэффициент асимметрии]]
-*[[Критерий однородности]]
-*[[Критерий согласия]]
-*[[Критерий Колмогорова-Смирнова]]
-*[[Критерий хи-квадрат]]
-*[[Точный тест Фишера]]
-=== Теория вычислительного обучения ===
-*[[:Категория:Теория вычислительного обучения]]
-*[[Теория статистического обучения]] = [[Теория вычислительного обучения]] = [[COLT]]
-*[[Контрольная выборка]]
-*[[Тестовая выборка]]
-*[[Эмпирическое предсказание]]
-*[[Обобщающая способность]] = [[Переобучение]] = [[Переподгонка]] = [[Оверфиттинг]] = [[Overfitting]]
-*[[Теория Вапника-Червоненкиса]]
-*[[Функция роста]] = [[Коэффициент разнообразия]] = [[Shattering]]
-*[[Ёмкость]] = [[Размерность Вапника-Червоненкиса]] = [[VC-dimension]] = [[VCdim]]
-*[[Структурная минимизация риска]]
-*[[Минимум длины описания]] = [[MDL]]
-*[[Сложность выборки]]
-*[[Скользящий контроль]] = [[Кросс-валидация]] = [[CV]]
-*[[Информационный критерий Акаике]] = [[Критерий Акаике]] = [[AIC]]
-*[[Байесовский информационный критерий]] = [[BIC]]
-=== Байесовская теория классификации ===
-*[[:Категория:Байесовская теория классификации]]
-*[[Байесовский классификатор]] = [[Оптимальный байесовский классификатор]]
-*[[Восстановление распределения вероятностей]]
-*[[Наивный байесовский классификатор]]
-*[[Линейный дискриминант Фишера]]
-*[[Смесь вероятностных распределений]] = [[Разделение смеси распределений]] = [[Расщепление смеси распределений]]
-*[[EM-алгоритм]]
-*[[Метод радиальных базисных функций]] = [[Сеть радиальных базисных функций]] = [[RBF]]
-*[[Метод парзеновского окна]] = [[Парзеновское окно]] = [[Окно Парзена]]
-=== Классификация на основе сходства ===
-*[[:Категория:Метрические алгоритмы классификации]] (классификация на основе сходства, similarity-based classification)
-*[[Гипотеза компактности]]
-*[[Матрица расстояний]]
-*[[Метрика]] = [[Функция расстояния]] = [[Сходство]]
-*[[Метод ближайших соседей]] = [[kNN]]
-*[[Метод потенциальных функций]]
-*[[Метод радиальных базисных функций]] = [[Сеть радиальных базисных функций]] = [[RBF]]
-*[[Метод парзеновского окна]] = [[Парзеновское окно]] = [[Окно Парзена]]
-*[[Проклятие размерности]]
-*[[CBR]] = [[Case based reasoning]] = [[Рассуждение на основе прецедентов]] (?)
-*[[Алгоритм STOLP]]
-*[[Алгоритм FRiS-STOLP]], [[функция конкурентного сходства]]
-=== Классификация на основе разделимости ===
-*[[Линейный классификатор]], [[:Категория:Линейные классификаторы]]
-*[[Машина опорных векторов]] = [[Метод опорных векторов]] = [[SVM]]
-*[[Логистическая регрессия]]
-*[[Ядро]]
-*[[Отступ]] = [[Зазор]]
-*[[Распределение отступов]]
-=== Байесовский вывод ===
-*[[:Категория:Байесовский вывод]]
-*[[Байесовский вывод]]
-*[[Метод релевантных векторов]] = [[RVM]]
-*[[Байесовская сеть]]
-=== Нейронные сети ===
-*[[:Категория:Нейронные сети]]
-*[[Нейронная сеть]] = [[ANN]]
-*[[Модель МакКаллока-Питтса]]
-*[[Персептрон]] = [[Перцептрон]] = [[Персептрон Розенблатта]] = [[Перцептрон Розенблатта]]
-*[[Задача XOR]]
-*[[Однослойный персептрон]] = [[Однослойный перцептрон]]
-*[[Многослойный персептрон]] = [[Многослойный перцептрон]]
-*[[Метод стохастического градиента]]
-*[[Метод обратного распространения ошибки]] = [[Backpropagation]] = [[Backprop]]
-*[[Сокращение весов]] = [[Редукция весов]](?) = [[Weight decay]]
-*[[Проблема паралича]] = [[Паралич сети]]
-*[[Оптимальное прореживание нейронных сетей]] = [[OBD]] = [[Оптимальное усечение сети]](?) = [[Оптимальное упрощение сети]](?)
-*[[Оптимальная хирургия мозга]](?) = [[OBS]] (??)
-*[[Конкурентное обучение]]
-*[[Нейронная сеть Кохонена]] = [[Сеть Кохонена]]
-*[[Самоорганизующаяся карта Кохонена]] = [[Карта Кохонена]] = [[SOM]]
-*[[Сеть встречного распространения]]
-*[[Ассоциативная память]]
-*[[Сеть Гроссберга]]
-*[[Сеть Хопфилда]]
-*[[Сеть Хэмминга]]
-=== Логические алгоритмы классификации ===
-*[[:Категория:Логические алгоритмы классификации]]
-*[[Логическая закономерность]]
-*[[Статистическая закономерность]]
-*[[Информативность]]
-*[[Индукция правил]]
-*[[Ассоциативные правила]] = [[правила ассоциации]]
-*[[Решающий список]]
-*[[Решающее дерево]]
-*[[Дерево регрессии]]
-*[[Критерий ветвления]]
-*[[Решающий лес]]
-*[[Редукция решающего дерева]] = [[Постредукция]] = [[Предредукция]]
-*[[Алгоритм вычисления оценок]]
-*[[Тестовый алгоритм]]
-*[[Принцип частичной прецедентности]]
-=== Кластерный анализ ===
-*[[:Категория:Кластеризация]]
-*[[Кластеризация]] = [[Кластерный анализ]]
-*[[Кластер]]
-*[[Графовые алгоритмы кластеризации]]
-*[[Кратчайший незамкнутый путь]] = [[Минимальное остовное дерево]]
-*[[Статистические алгоритмы кластеризации]]
-*[[Алгоритм ФОРЕЛЬ]]
-*[[Алгоритм k средних]] = [[k-means]]
-*[[Иерархическая кластеризация]]
-*[[Таксономия]]
-*[[Дендрограмма]]
-*[[Нейронная сеть Кохонена]] = [[Сеть Кохонена]]
-*[[Ансамбль кластеризаторов]]
-*[[Многомерное шкалирование]] = [[MDS]]
-*[[Диаграмма Шеппарда]]
-*[[Карта сходства]]
-*[[Сегментация]]
-=== Корреляционный анализ и регрессия ===
-*[[:Категория:Регрессия]]
-*[[Регрессия]] = [[Регрессионный анализ]]
-*[[Линейная регрессия]]
-*[[Шаговая регрессия]]
-*[[Криволинейная регрессия]]
-*[[Корреляция]]
-*[[Ранговая корреляция]]
-*[[Корреляционный анализ]]
-*[[Метод наименьших квадратов]]
-*[[Мультиколлинеарность]]
-*[[Обобщенная линейная модель]] = [[GLM]]
-*[[Коррелограмма]]
-=== Прогнозирование ===
-*[[:Категория:Прогнозирование]]
-*[[Прогнозирование]]
-*[[Временной ряд]]
-*[[Авторегрессия]]
-*[[Скользящее среднее]]
-*[[ARIMA]]
-*[[ARMA]]
-*[[GARCH]]
-=== Сокращение размерности ===
-*[[:Категория:Сокращение размерности]]
-*[[Селекция признаков]]
-*[[Синтез признаков]] = [[Извлечение признаков]]
-*[[Метод главных компонент]] = [[PCA]]
-*[[Метод независимых компонент]] = [[ICA]]
-*[[Шаговая регрессия]] = [[AddDel]] = [[Add-Del]]
-*[[Лассо]]
-*[[LARS]]
-*[[Метод группового учета аргументов]] = [[МГУА]]
-*[[Самоорганизация моделей]]
-*[[Внутренний критерий]]
-*[[Внешний критерий]]
-*[[Генетический алгоритм]]
-*[[Эволюционный алгоритм]]
-*[[Случайный поиск]]
-*[[Стохастический локальный поиск]] = [[Локальный стохастический поиск]] = [[Локальный случайный поиск]] = [[Случайный локальный поиск]] = [[SLS]]
-*[[Случайный поиск с адаптацией]] = [[СПА]]
-*[[Комбинаторный взрыв]]
-=== Алгоритмические композиции ===
-*[[:Категория:Композиции алгоритмов]] = [[Алгоритмические композиции]]
-*[[Композиция алгоритмов]] = [[Алгоритмическая композиция]]
-*[[Ансамбль алгоритмов]]
-*[[Базовый алгоритм]]
-*[[Метод комитетов]]
-*[[Бустинг]]
-*[[Бэггинг]]
-*[[Метод случайных подпространств]] = [[RSM]]
-*[[Смесь экспертов]] = [[Смесь алгоритмов]] = [[ME]]
-*[[Область компетентности]]
-*[[Алгебраический подход к проблеме распознавания]]
-*[[Теория универсальных и локальных ограничений]]
-*[[Алгоритмический оператор]]
-*[[Корректирующая операция]]
-*[[Решающее правило]]
-=== Предварительный анализ данных ===
-*[[:Категория:Предварительный анализ данных]]
-*[[Предварительный анализ данных]] = [[Разведочный анализ данных]]
-*[[Нормальзация данных]]
-*[[Визуализация данных]]
-*[[Понимание данных]]
-Projection pursuit
-=== Интеллектуальный анализ данных ===
-*[[:Категория:Интеллектуальный анализ данных]] и статья [[Интеллектуальный анализ данных]]
-*[[Интеллектуальный анализ данных]] = [[Data Mining]]
-*[[Анализ текста]] = [[Text Mining]]
-*[[Анализ веба]] = [[Web Mining]]
-*[[Анализ контента]] = [[Web Content Mining]]
-*[[Анализ структуры веба]] = [[Web Structure Mining]]
-*[[Анализ посещаемости]] = [[Web Usage Mining]]
-*[[Коллаборативная фильтрация]]
-*[[Анализ клиентских сред]]
-*[[Рекомендующие системы]]
-*[[Персонализация]]
-*[[Управление взаимоотношениями с клиентами]] = [[CRM]]
-*[[Анализ рыночных корзин]]
-=== Теории, научные школы ===
-*[[Теория возможности]]
-*[[Теория нечётких множеств]]
-=== Предметные области ===
-*[[Медицинская диагностика]]
-*[[Техническая диагностика]]
-*[[Дифференциальная диагностика]]
-*[[Кредитный скоринг]]
-*[[Предсказание ухода клиентов]]
-*[[Обнаружение мошенничества]]
-*[[Прогнозирование продаж]]
-*[[Персонализация]]
-== Внутренняя кухня MachineLearning.ru ==
-=== Служебные страницы ===
-* [[MachineLearning:Концепция ресурса]]
-* [[MachineLearning:Инструктаж]]
-* [[MachineLearning:Правила именования статей]] — порядок выбора названий страниц при их создании.
-* [[MachineLearning:Категоризация]] — порядок создания категорий.
-* [[MachineLearning:Публикации и библиографии]] — порядок создания страниц о публикациях.
-* [[MachineLearning:Авторское право]] — некоторые юридические аспекты работы с Ресурсом.
-* [[MachineLearning:Политика конфиденциальности]] — некоторые аспекты информационной безопасности.
-* [[MachineLearning:Учебный процесс]] — рекомендации студентам и преподавателям.
-* [[:Категория:MachineLearning:Руководства]] — всё выше перечисленное и, быть может, ещё что-то.
-* [[MachineLearning:Справка]]
-* [[MachineLearning:ЧаВО]]
-* [[MachineLearning:Портал сообщества]]
-* [[MachineLearning:Вниманию участников]]
-* [[Шаблон:Новости]] и [[Новости]]
-* [[:Категория:Научные направления]]
-=== Интересные спецстраницы ===
-* [[Special:Uncategorizedpages|Некатегоризованные страницы]] — зайти и категоризировать!
-* [[Special:Uncategorizedcategories|Некатегоризованные категории]] — аналогично!
-* [[Special:Popularpages|Популярные страницы]] — их качество доводить до блеска!
-* [[Special:Wantedpages|Требуемые страницы]] — писать или искать писателей!
-* [[:Категория:Незавершённые статьи]] — дописывать или искать дописывателей!
-* [[Special:Listusers|Список участников]] — кто у нас новенький? у кого страничка появилась?
-* [[Special:Statistics|Статистика]] — сколько нас, сколько мы уже накатали, и что из этого чаще читают?
-* [[MachineLearning:Динамика|Динамика]] — как быстро мы растём?
-* [[MediaWiki:Edittools]] — панель «Быстрая вставка» под окном редактирования
-* [[MediaWiki:NewUserMessage]] — приветственное сообщение новому пользователю
-=== Шаблоны ===
-* [[Special:Allpages/Шаблон:|'''Все доступные шаблоны''']]
-* [[Шаблон:Заглавная страница Основные категории]]
-'''Мои шаблоны'''
+Параллельная распределённая реализация методов вероятностного тематического моделирования на основе [[АРТМ|аддитивной регуляризации]].
-* [[Шаблон:eqno]], [[Шаблон:eqref]] — нумерации формул справа и ссылка на нумерованную формулу
+Реализация ядра библиотеки на С++, интерфейсы на C++, Python.
-* [[Шаблон:tip]], [[Шаблон:stop]], [[Шаблон:UnderConstruction]],[[Шаблон:well]], [[Шаблон:notice]] — объявления разных цветов с галочкой
+Позволяет добавлять новые регуляризаторы и метрики качества.
-* [[Шаблон:ins]], [[Шаблон:del]], [[Шаблон:rem]] — эмуляция режима правки MS Word
+:Страница: [https://github.com/bigartm github.com/bigartm]
-* [[Шаблон:todo]], [[Шаблон:TodoEndList]] — для оформления [[MachineLearning:ToDo]] и любых других списков планов
+:Документация: [http://bigartm.org bigartm.org]
-* [[Шаблон:Врезка]] — врезка справа, как в Википедии
+:Архитектор проекта [[Участник:Фрей Александр|Александр Фрей]]
-* [[Шаблон:Задание]] —  предупреждение, что статья является непроверенной учебной работой
-* [[Шаблон:ЗаданиеВыполнено]] —  предупреждение, что статья была сделана в рамках учебной работы
-'''Основные шаблоны для библиографий:'''
+* '''[[TopicNet]] — Открытая библиотека тематического моделирования под Python''' (текущий проект)
-* [[Шаблон:Монография]]
-* [[Шаблон:Статья]]
-* [[Шаблон:Тезисы]]
-* [[Шаблон:Диссертация]]
-* [[Шаблон:ВКР]]
-* [[Шаблон:Учебник]]
-* [[Шаблон:Отчёт]]
-* [[Шаблон:Документ]]
-* [[Шаблон:Публикация]]
-'''Вспомогательные шаблоны для библиографий:'''
+Верхнеуровневая обёртка над [[BigARTM]], упрощающая построение тематических моделей в прикладных проектах и автоматизирующая проведение вычислительных экспериментов по оптимизации моделей.
-* [[Шаблон:книга]] — оформление библиографической записи, из [http://ru.wikipedia.org/wiki/%D0%A8%D0%B0%D0%B1%D0%BB%D0%BE%D0%BD:%D0%9A%D0%BD%D0%B8%D0%B3%D0%B0 Википедии]
+:Страница:  [https://github.com/machine-intelligence-laboratory/TopicNet github.com/machine-intelligence-laboratory/TopicNet]
-* [[Шаблон:биб.статья]] — оформление библиографической записи, из [http://ru.wikipedia.org/wiki/%D0%A8%D0%B0%D0%B1%D0%BB%D0%BE%D0%BD:%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F Википедии]
+:Разработка [http://machine-intelligence.ru лаборатории машинного интеллекта МФТИ]
-* [[Шаблон:переводы]] — одно и то же на всех языках, пример: <nowiki>{{переводы|{{{язык}}}|Т|Vol}}</nowiki>
-* [[Шаблон:russian]], [[Шаблон:english]] — позволяют сократить синтаксис: <nowiki>{{{{{язык}}}|Т|Vol}}</nowiki>
-* [[Шаблон:ВсеАвторы]] — формирование списка авторов в библиографических записях
-* [[Шаблон:BibtexAuthors]] — формирование списка авторов в [[BibTeX]]-записях
-* [[Шаблон:Подробнее]] — формирование ссылки на страницу с описанием публикации
-* [http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9F%D1%80%D0%BE%D0%B5%D0%BA%D1%82:%D0%91%D0%B8%D0%B1%D0%BB%D0%B8%D0%BE%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%8F Википедия:Проект:Библиография] — у Большого Брата проблема оформления библиографий тоже пока не решена...
-'''Программирование в шаблонах:'''
+* '''[https://SciSearch.ai SciSearch.ai] — пилотный проект «Мастерской знаний» ''' (текущий проект)
-* [http://meta.wikimedia.org/wiki/ParserFunctions Справка по условным функциям]
-* [http://meta.wikimedia.org/wiki/Help:Magic_words Волшебные слова]
-== Литература (страницы публикаций) ==
+Поисково-рекомендательная система для формирования и анализа тематических подборок англоязычных научных статей.
-# {{П:Вапник 74}}
-# {{П:Вапник 79}}
-# {{П:Журавлёв 1978 Об алгебраическом подходе}}
-# {{П:Журавлёв 2006 Распознавание}}
-# {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}}
-# {{П:Зиновьев 2000 Визуализация многомерных данных}}
-# {{П:Рудаков 1992 Алгебраическая теория}}
-# {{П:Hastie 2001 The Elements of Statistical Learning}}
 == Аспиранты и студенты ==
@@ Строка 680: / Строка 719: @@
 |align="center"|'''Аспиранты'''
 |width="50"|
-|align="center"|'''ФУПМ МФТИ'''
+|align="center"|'''МФТИ'''
 |width="50"|
-|align="center"|'''ВМиК МГУ'''
+|align="center"|'''МГУ'''
 |-
 |valign="top"|
-* Василий Лексин
+<!---
-* [[Участник:Павел Ботов|Павел Ботов]]
+* [[Участник:Romanenko|Алексей Романенко]]
-* Иван Гуз
+* [[Участник:EvgSokolov|Евгений Соколов]]
-* Павел Кудинов
+* [[Участник:Peter Romov|Пётр Ромов]]
-* Николай Суровенко
+* Виктор Кантор
+* [[Участник:Bunakov|Василий Бунаков]]
+* Шаура Ишкина
+* Александр Корабельников
+* Анжелика Сухарева
+* Арина Агеева
+* Александр Кузьмин
+* Роман Дербаносов
+---->
+* Илья Жариков
 ----
-* [[Участник:Riabenko|Евгений Рябенко]]
+* Юлиан Сердюк
-* Максим Иванов
-* [[Участник:Nikita Pustovoytov|Никита Пустовойтов]]
-* Владимир Шейнин
 ----
-* [[Участник:Фрей Александр|Александр Фрей]]
+* Василий Алексеев
-* [[Участник:Tolstikhin|Илья Толстихин]]
+* Полина Потапова
-* [[Участник:Slimper|Илья Решетняк]]
+* Олег Сомов
-* Кирилл Чувилин
+* Николай Герасименко
+* Кирилл Хрыльченко
 ----
-* [[Участник:Nastya Zukhba|Анастасия Зухба]]
+* Дарья Соболева
-* [[Участник:Romanenko|Алексей Романенко]]
+* Николай Скачков
-* Мария Когадеева
 ----
-* [[Участник:Denis Kochedykov|Денис Кочедыков]]
+* Светлана Крыжановская
-* [[Участник:Lisitsa|Андрей Лисица]]
+* Алексей Гришанов
-* [[Участник:Даниил Каневский|Даниил Каневский]]
 |
 |valign="top"|
-* Никита Спирин
+* Виктор Панкратов
-* Юрий Янович
-* Игорь Литвинов
-----
-* Никита Животовский
-* Александр Мафусалов
-* Александр Фирстенко
 ----
-* Михаил Бурмистров
+* Иван Лукьяненко
-* Александр Романенко
+* Георгий Жаров
-* Михаил Кокшаров
 |
 |valign="top"|
-* Александр Колесников
+* Арсений Веселов
-* Дмитрий Солодкин
+----
-* Марина Дударенко
+* Анна Балакова
-* Ольга Исупова
+* Евгений Косарев
+* Сергей Артамонов
 ----
-* Евгений Соколов
+* Воробьев Сергей
-* Валентин Полежаев
+* Дзюба Мария
-* Иван Шанин
+* Морозов Ярослав
-* Кирилл Гаврилюк
 ----
-* Анна Потапенко
+* Авдеев Роман
-* Тимур Исмагилов
+* Мелихов Дмитрий
-* Ильдар Шаймарданов
+* Панин Никита
+* Черникова Полина
 |}
 ===Бакалаврские диссертации===
 # Дмитрий Иванцов. Новые методы технического анализа фьючерсных рынков. 2003. МФТИ.
-# Рустем Таханов. Некоторые комбинаторные оценки каче-ства обучения по прецедентам. 2004. МФТИ.
+# Рустем Таханов. Некоторые комбинаторные оценки качества обучения по прецедентам. 2004. МФТИ.
 # Дмитрий Житлухин. О некоторых алгоритмах синтеза неэквивалентных матриц Адамара. 2005. МФТИ.
 # [[Участник:Andyray|Андрей Ивахненко]]. Исследование обобщающей способности логических алгоритмов классификации. 2005. МФТИ.
@@ Строка 753: / Строка 791: @@
 # Артур Коваль. Прогнозирование временных рядов с несимметричным функционалом потерь. 2007. МФТИ.
 # Александр Ширяев. Выбор опорных множеств в алгоритмах типа вычисления оценок: нейросетевой подход. 2007. ВМК МГУ.
-# Ирина Лебедева. Об одном подходе к анализу доходности и рейтингованию паевых инвестиционных фондов. 2008. МФТИ.
+# Ирина Лебедева. Об одном методе статистически обоснованного сравнения временных рядов доходности паевых инвестиционных фондов. 2008. МФТИ.
-# [[Участник:Фрей Александр|Александр Фрей]]. Аналоги неравенства Хёфдинга в слабой вероятностной аксиоматике. 2008. МФТИ.
+# [[Участник:Фрей Александр|Александр Фрей]]. О дискретных аппроксимациях непрерывных вероятностных распределений. 2008. МФТИ.
 # Кирилл Чувилин. Проблема переобучения при отборе признаков по внешним критериям в многомерной линейной регрессии. 2008. МФТИ.
-# Пётр Цюрмасто. Влияние различности алгоритмов на обобщающую способность в методе минимизации эмпирического риска. 2008. МФТИ.
+# Пётр Цюрмасто. Влияние различности алгоритмов на обобщающую способность метода минимизации эмпирического риска. 2008. МФТИ.
-# Андрей Бадзян. О некоторых комбинаторных аналогах неравенства МакДиармида. 2008. МФТИ.
+# Андрей Бадзян. Комбинаторный аналог неравенства МакДиармида и обобщающая способность стабильных алгоритмов. 2008. МФТИ.
 # [[Участник:Nastya Zukhba|Анастасия Зухба]]. Метрические алгоритмы классификации с отбором опорных объектов. 2009. МФТИ.
 # [[Участник:Pavel Minaev|Павел Минаев]]. Расширенная методика тестирования алгоритмов классификации. 2009. МФТИ.
@@ Строка 770: / Строка 808: @@
 # Александр Мафусалов. Комбинаторные оценки вероятности переобучения пороговых классификаторов. 2011. МФТИ.
 # Александр Фирстенко. Методы выделения терминов и тематической классификации текстовых документов. 2011. МФТИ.
+# Михаил Кокшаров. Комбинаторные оценки обобщающей способности на основе попарного сравнения алгоритмов. 2012. МФТИ.
+# Михаил Бурмистров. Методы оптимизации параметров вероятностных тематических моделей. 2012. МФТИ.
+# [[Участник:Angriff|Александр Романенко]]. [[Media:romanenko2012bach.pdf|Категоризация текстов на основе монотонного классификатора ближайшего соседа]]. 2012. МФТИ.
+# Илья Ямщиков. Методы обучаемого ранжирования для поиска релевантных алгоритмов классификации. 2012. МФТИ.
+# Ильдар Газизов. Проект информационно-аналитической системы для поддержки консультирования по функционально-ролевой модели бизнеса. 2012. МФТИ.
+# [[Участник:Stepka974|Степан Лобастов]]. [[Media:lobastov2013diploma.pdf|Построение тематической классификации коллекции документов с неизвестным числом тем]], [[Media:lobastov2013presentation.pdf|презентация]]. 2013. МФТИ.
+# [[Участник: Celyh|Влада Целых]]. [[Media:Tselykh2013Diploma.pdf|Статистические критерии адекватности вероятностных тематических моделей коллекции текстовых документов]], [[Media:Tselykh2013Presentation.pdf|презентация]]. 2013. МФТИ.
+# [[Участник:Tsyganova|Светлана Цыганова]]. Выявление несогласованностей в иерархической тематической модели с фиксированной иерархией. 2013. МФТИ.
+# Александр Бырдин. Классификация текстовых объявлений. 2014. МФТИ.
+# [[Участник:Voronov|Сергей Воронов]]. [[Media:Voronov2014Classification.pdf‎|Фильтрация и тематическое моделирование коллекции научных документов]]. 2014. МФТИ.
+# [[Участник:Oleg.Grinchuk|Олег Гринчук]]. Классификация нестационарного потока текстовых объявлений, [[Media:Grinchuk2014presentation.pdf|презентация]]. 2014. МФТИ.
+# [[Участник:K.necludov|Кирилл Неклюдов]]. [[Media:AnomalyDetection.pdf‎|Обнаружение аномалий в дискретных временных рядах]], [[Media:Neklyudov2014Presentation.pdf|презентация]]. 2014. МФТИ.
+# [[Участник:Ryskina|Мария Рыскина]]. [[Media:Ryskina2014BSc.pdf‎|Регуляризация вероятностных тематических моделей для повышения устойчивости и интерпретируемости]]. 2014. МФТИ.
+# [[Участник:Yashkov|Даниил Яшков]]. [[Media:Yashkov2014Theme.pdf‎|Методы понижения размерности в задаче поиска аномалий в многомерных временных рядах]], [[Media:Yashkov2014Theme_Slides.pdf|презентация]]. 2014. МФТИ.
+# Андрей Шапулин. Регуляризация вероятностных тематических моделей для классификации символьных последовательностей. 2015. ВМК МГУ.
+# Михаил Хальман. Методы персонализации показа объявлений в рекламной сети. 2015. ВМК МГУ.
+# Никита Дойков. [[Media:2015_417_DoykovNV.pdf|Адаптивная регуляризация вероятностных тематических моделей]]. 2015. ВМК МГУ.
+# [[Участник:Mapishev|Мурат Апишев]]. [[Media:Apishev2015BSc.pdf‎|Мультимодальные регуляризованные вероятностные тематические модели]]. 2015. ВМК МГУ.
+# Александра Кузнецова. Методы регуляризации для отбора признаков в линейных классификаторах и их применение в банковской клиентской аналитике. 2015. ВШЭ.
+# Алексей Гринчук.  [[Media:AGrinchuk2015bsc.pdf|Использование контекстной документной кластеризации для улучшения качества тематических моделей]]. 2015. МФТИ.
+# [[Участник:Iefimova|Ирина Ефимова]].  Формирование однородных обучающих выборок в задачах классификации. 2015. МФТИ.
+# [[Участник:Aignatov|Андрей Игнатов]].  Deep Learning in information analysis of electrocardiogram signals for disease diagnostics. 2015. МФТИ.
+# Анна Липатова.  Выделение мультиграммных признаков в задачах классификации символьных последовательностей. 2015. МФТИ.
+# Анастасия Макарова.  Выделение информативных признаков заболеваний в информационном анализе электрокардиосигналов. 2015. МФТИ.
+# [[Участник:Aplavin|Александр Плавин]].  [[Media:Plavin2015Bsc.pdf|Отбор тем в задачах тематического моделирования]]. 2015. МФТИ.
+# Михаил Швец.  Монотонные классификаторы для задач медицинской диагностики. 2015. МФТИ.
+# Михаил Шинкевич. Применение коллаборативной фильтрации, активного обучения и навигационной корреляции в задаче выделения селекторов. 2015. МФТИ.
+# [[Участник:Nchirkova|Надежда Чиркова]]. [[Media:2016_417_ChirkovaNA.pdf|Иерархические тематические модели для интерактивной навигации по коллекциям текстовых документов]]. 2016. ВМК МГУ.
+# Никита Шаповалов. Тематические модели для классификации символьных последовательностей в задачах биоинформатики и анализа биомедицинских сигналов. 2016. ВМК МГУ.
+# Юлия Молчанова. [[Media:Molchanova2016Bsc.pdf|Проверка адекватности тематических моделей в онлайновых алгоритмах]]. 2016. ВМК МГУ.
+# Иван Ивашковский. [[Media:Ivashkovskiy2016Bsc.pdf|Методы инициализации в вероятностном тематическом моделировании]]. 2016. ФИВТ МФТИ.
+# Анастасия Янина. [[Media:Yanina2016Bsc.pdf|Мультимодальные тематические модели статей коллективных блогов для разведочного поиска]]. 2016. ФИВТ МФТИ.
+# Илья Жариков. Статистические тесты однородности символьных последовательностей. 2016. ФУПМ МФТИ.
+# Евгений Смирнов. Суммаризация тем в вероятностном тематическом моделировании. 2016. ФУПМ МФТИ.
+# Светлана Шишковец. Аддитивная регуляризация наивного линейного байесовского классификатора. 2016. ФУПМ МФТИ.
+# Роза Айсина. [[Media:2017AysinaBsc.pdf|Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным]]. 2017. ВМК МГУ.
+# [[Участник:Arti lehtonen|Артём Попов]]. [[Media:2017PopovBsc.pdf|Регуляризация тематических моделей для векторных представлений слов]]. 2017. ВМК МГУ.
+# Владимир Полушин. [[Media:2017PolushinBsc.pdf|Тематические модели для ранжирования рекомендаций текстового контента]]. 2017. ВМК МГУ.
+# Владислав Батаев. Тематическая сегментация разговоров контактного центра. 2017. ФИВТ МФТИ.
+# Карен Манукян. Интеллектуальная диалоговая система для автоматизации деятельности контакт-центра. 2017. ФИВТ МФТИ.
+# Александр Софиенко. Классификация положительных и неразмеченных текстовых документов. 2017. ФИВТ МФТИ.
+# [[Участник:Fedimser|Дмитрий Федоряка]]. [[Media:fedoriaka17bsc.pdf|Технология интерактивной визуализации тематических моделей]]. 2017. ФУПМ МФТИ.
+# Ольга Цветкова. Анализ банковских транзакционных данных для выявления паттернов экономического поведения клиентов. 2017. ФУПМ МФТИ.
+# Виталий Малыгин. Формирование репрезентативных обучающих выборок. 2017. ФУПМ МФТИ.
+# Дарья Соболева. [[Media:soboleva18bsc.pdf|Языковое моделирование в задаче построения вопрос-ответной системы]]. 2018. ВМК МГУ.
+# Николай Кругликов. [[Media:kruglikov18bsc.pdf|Тематическое моделирование текстовых коллекций в диалоговых системах]]. 2018. ВМК МГУ.
+# Анастасия Фадеева. [[Media:fadeeva18bsc.pdf|Темпоральное моделирование новостных потоков]]. 2018. ФКН НИУ ВШЭ.
+# Мария Селезнёва. [[Media:Seleznova2018BachelorThesis.pdf|Построение и оценка качества гетерогенных иерархических тематических моделей]]. 2018. ФУПМ МФТИ.
+# Василий Алексеев. [[Media:Alekseev2018BachelorThesis.pdf|Внутритекстовая когерентность как мера интерпретируемости тематических моделей текстовых коллекций]]. 2018. ФУПМ МФТИ.
+# Антон Захаренков. [[Media:Zakharenkov2018BSthesis.pdf|Итеративный подбор коэффициентов регуляризации тематических моделей]]. 2018. ФУПМ МФТИ.
+# Даниил Фельдман. [[Media:feldman18bsc.pdf|Использование фактов для поиска мнений в новостях]]. 2018. ФУПМ МФТИ.
+# Филипп Никитин. [[Media:nikitin18bsc.pdf|Применение мультимодальных тематических моделей к анализу транзакционных данных]]. 2018. ФУПМ МФТИ.
+# Анастасия Павловская. [[Media:pavlovskaya18bsc.pdf|Тематическое моделирование в задаче классификации отзывов покупателей о работе и ассортименте продуктового магазина]]. 2018. ФУПМ МФТИ.
+# Николай Скачков. [[Media:skachkov19bsc.pdf|Тематико-стилистические векторные представления текстовых пользовательских запросов]]. 2019. ВМК МГУ.
+# Михаил Солоткий. [[Media:solotkiy19bsc.pdf|Вероятностные тематические модели на основе данных о со-встречаемости слов]]. 2019. ВМК МГУ.
+# Галина Фоминская. [[Media:fominskaya19bsc.pdf|Проблема несбалансированности тем в вероятностных тематических моделях]]. 2019. ВМК МГУ.
+# Николай Шаталов. [[Media:shatalov19bsc.pdf|Методы обучения без учителя для автоматического выделения составных терминов в текстовых коллекциях]]. 2019. ВМК МГУ.
+# Вадим Захаренко. Методы обнаружения новых тем в вероятностных тематических моделях. 2019. ВМК МГУ.
+# Анастасия Кряжова. [[Media:kryazhova19bsc.pdf|Методы оценивания семантической близости фраз для классификации текстовых сообщений]]. 2019. НИУ ВШЭ.
+# Анна Рогозина. [[Media:rogozina19bsc.pdf|Проверка гипотезы условной независимости для оценивания качества тематической кластеризации]]. 2019. ФПМИ МФТИ.
+# Евгений Козлинский. [[Media:kozlinskiy19bsc.pdf|Сегментация транзакционных данных розничных клиентов банка]]. 2019. ФПМИ МФТИ.
+# Вадим Кислинский. [[Media:kislinskiy19bsc.pdf|Построение мультимодальной рекомендательной системы]]. 2019. ФПМИ МФТИ.
+# Павел Плюснин. [[Media:plusnin19bsc.pdf|Итерационные методы балансировки тем в тематическом моделировании]]. 2019. ФПМИ МФТИ.
+# Максим Еремеев. [[Media:eremeev20bsc.pdf|Ранжирование текстовых документов на основе оценок когнитивной сложности текстов]]. 2020. ВМК МГУ.
+# Алексей Гришанов. [[Media:grishanov20bsc.pdf|Построение рекомендательной системы, основанной на обучении с подкреплением]]. 2020. ФПМИ МФТИ.
+# Вадим Новоселов. [[Media:Novoselov20bsc.pdf|Темпоральные тематические модели новостных потоков с возможностью обнаружения новых тем и событий]]. 2021. ВМК МГУ.
+# Виктор Панкратов. [[Media:Pankratov21bsc.pdf|Вероятностное тематическое моделирование несбалансированных текстовых коллекций]]. 2021. ФПМИ МФТИ.
+# Анна Балакова. [[Media:Balakova22bsc.pdf|Выявление поляризации мнений в новостных текстах методами обучения без учителя]]. 2022. ВМК МГУ.
+# Василий Висков. [[Media:Viskov22bsc.pdf|Методы обучения без учителя для выделения поляризаций в новостных потоках]]. 2022. ВМК МГУ.
+# Евгений Косарев. [[Media:Kosarev22bsc.pdf|Нейросетевые модели языка для выявления речевых манипуляций в новостных потоках]]. 2022. ВМК МГУ.
+# Сергей Воробьёв. [[Media:Vorobiev23bsc.pdf|Модели выявления манипуляций и их мишеней в новостных сообщениях]]. 2023. ВМК МГУ.
+# Мария Дзюба. [[Media:Dzuba23bsc.pdf|Нейросетевые модели языка для ранжирования фраз в полуавтоматической суммаризации научных статей]]. 2023. ВМК МГУ.
+# Ярослав Морозов. [[Media:Morozov23bsc.pdf|Выделение трендов в коллекциях научных статей]]. 2023. ВМК МГУ.
+# Георгий Жаров. [[Media:Zharov23bsc.pdf|Поиск связи фрагментов манипуляций с именованными сущностями в текстах]]. 2023. ФПМИ МФТИ.
+# Иван Лукьяненко. [[Media:Lukyanenko23bsc.pdf|Выявление манипуляций в новостях]]. 2023. ФПМИ МФТИ.
 ===Магистерские диссертации===
@@ Строка 776: / Строка 889: @@
 # [[Участник:Denis Kochedykov|Денис Кочедыков]]. Разработка, реализация и тестирование специализированной библиотеки логических алгоритмов классификации. 2005. ВМК МГУ.
 # Александр Кругов. Поиск закономерностей и принятие решений по дискретным временным рядам. 2006. МФТИ.
-# Дмитрий Житлухин. Методы распознавания спама на основе совместного анализа содержимого и действий множества пользователей. 2007. МФТИ.
+# Дмитрий Житлухин. Персонализированная рубрикация текстовых сообщений. 2007. МФТИ.
-# [[Участник:Andyray|Андрей Ивахненко]]. Методы управления обобщающей способностью в логических алгоритмах классификации.  2007. МФТИ.
+# [[Участник:Andyray|Андрей Ивахненко]]. Методы улучшения обобщающей способности логических алгоритмов классификации.  2007. МФТИ.
-# Василий Лексин. Технология персонализации на основе выявления скрытых характеристик пользователей и ресурсов Интернет. 2007. МФТИ.
+# Василий Лексин. Технология персонализации на основе выявления тематических профилей пользователей и ресурсов Интернет. 2007. МФТИ.
 # Фёдор Ульянов. Оценивание обобщающей способности функций близости при оптимизации модели АВО. 2007. МФТИ.
-# Сергей Ументаев. Методы отбора информативных слагаемых в сумме временных рядов. 2007. МФТИ.
+# Сергей Ументаев. Проблема переобучения при отборе признаков в линейной регрессии с фиксированными коэффициентами. 2007. МФТИ.
-# Иван Гуз. Проблема обобщающей способности и оптимизация профиля монотонности в композициях классификаторов. 2008. МФТИ.
+# Иван Гуз. [[Media:Guz2008ms.pdf|Проблема обобщающей способности и оптимизация профиля монотонности в композициях классификаторов]]. 2008. МФТИ.
 # Александр Маценов. Профиль разделимости и обобщающая способность линейных композиций классификаторов. 2008. МФТИ.
 # Геннадий Федонин. Композиции алгоритмов предсказания рейтингов в системах рекомендаций. 2008. МФТИ.
 # [[Участник:Nikita Pustovoytov|Никита Пустовойтов]]. Поиск схожих пользователей социальных сетей методами коллаборативной фильтрации. 2009. МФТИ.
 # Александр Орлов. Комбинаторные оценки вероятности переобучения для случая произвольной заданной матрицы ошибок. 2009. МФТИ.
-# Артур Коваль. Построение адаптивных композиций алгоритмов прогнозирования при несимметричной функции потерь. 2009. МФТИ.
+# Артур Коваль. [[Media:koval2009ms.pdf|Построение адаптивных композиций алгоритмов прогнозирования при несимметричной функции потерь]]. 2009. МФТИ.
 # Ирина Лебедева. Методы повышения обобщающей способности логических алгоритмов классификации. 2010. МФТИ.
-# [[Участник:Фрей Александр|Александр Фрей]]. Точные оценки вероятности переобучения для рандомизированного метода минимизации эмпирического риска. 2010. МФТИ.
+# [[Участник:Фрей Александр|Александр Фрей]]. [[Media:Frey2010ms.pdf|Точные оценки вероятности переобучения для рандомизированного метода минимизации эмпирического риска]]. 2010. МФТИ.
-# Кирилл Чувилин. Интеллектуальная система автоматизации корректуры текстовых документов в формате LaTeX. 2010. МФТИ.
+# Кирилл Чувилин. Проект интеллектуальной системы для автоматизации коррекции документов в формате LaTeX. 2010. МФТИ.
 # Пётр Цюрмасто. Точные комбинаторные оценки вероятности переобучения для цепочек алгоритмов. 2010. МФТИ.
 # [[Участник:Nastya Zukhba|Анастасия Зухба]]. Вычислительная сложность задачи отбора опорных объектов в методе ближайших соседей. 2011. МФТИ.
-# [[Участник:Pavel Minaev|Павел Минаев]]. Методика тестирования алгоритмов классификации в системе Полигон и её обоснования. 2011. МФТИ.
+# [[Участник:Pavel Minaev|Павел Минаев]]. [[Media:Minaev2011ms.pdf|Методика тестирования алгоритмов классификации в системе Полигон и её обоснования]]. 2011. МФТИ.
 # [[Участник:Romanenko|Алексей Романенко]]. Методы агрегирования адаптивных алгоритмов прогнозирования. 2011. МФТИ.
+# Игорь Литвинов. Методы уточнения карты дорог по данным GPS-сигналов автомобилей. 2012. МФТИ.
+# Никита Спирин. [[Media:Spirin2012ms.pdf|Структурированный поиск с числовыми и логическими ограничениями в неструктурированных Веб-коллекциях]]. 2012. МФТИ.
+# [[Участник:Nkzh|Никита Животовский]]. [[Media:Zhivotivskiy2013MsThesis.pdf|Концентрация меры в комбинаторных оценках обобщающей способности]]. 2013. МФТИ.
+# Виталий Глушаченков. [[Media:Glushachenkov2013MsThesis.pdf|Устойчивость матричных разложений в задачах тематического моделирования]]. 2013. МФТИ.
+# [[Участник:Almaf|Александр Мафусалов]]. [[Media:Mafusalov2013ms.pdf|Оценивание вероятности успеха в серии испытаний Бернулли по другой серии при наличии зависимости между вероятностями успеха]]. 2013. МФТИ.
+# [[Участник:Kolt|Николай Савинов]]. [[Media:SavinovThesis2013.pdf|Классификация эмоциональной окраски сообщений в социальных сетях]]. 2013. МФТИ.
+# Андрей Романов. [[Media:Romanov-2013-ms.pdf|Методы упрощения композиций, получаемых при градиентном бустинге]]. 2013. МФТИ.
+# [[Участник:Angriff|Александр Романенко]]. [[Media:Romanenko2014Application.pdf|Применение условных случайных полей в задачах обработки текстов на естественном языке]]. 2014. МФТИ.
+# Илья Ямщиков. [[Media:Yamshchikov-2014-ms.pdf|Математические методы диагностики ишемической болезни по электрокардиограмме сверхвысокого разрешения]]. 2014. МФТИ.
+# [[Участник: Celyh|Влада Целых]]. [[Media:Tselykh2015Diploma.pdf|Статистические обоснования информационного анализа электрокардиосигналов для диагностики заболеваний внутренних органов]]. 2015. МФТИ.
+# [[Участник:Tsyganova|Светлана Цыганова]]. Применение тематической модели классификации в информационном анализе электрокардиосигналов. 2015. МФТИ.
+# [[Участник:Bunakov|Василий Бунаков]]. [[Media:Bunakov2015MSThesis.pdf|Методы нечеткого кодирования в информационном анализе электрокардиосигналов]]. 2015. МФТИ.
+# [[Участник:Steninss|Сергей Стенин]]. [[Media:Stenin2015MasterThesis.pdf|Мультиграммные аддитивно регуляризованные тематические модели]]. 2015. МФТИ
+# Дмитрий Аникушин. Использование вероятностных тематических моделей для персонализации показов рекламы. 2015. ФИВТ МФТИ.
+# Дмитрий Гронский. Аддитивная регуляризация тематических моделей для задачи классификации символьных последовательностей. 2015. ФИВТ МФТИ.
+# Кирилл Остапенко. Выявление случаев мошенничества в онлайн-играх методами машинного обучения. 2015. ФИВТ МФТИ.
+# Виктор Булатов. [[Media:Bulatov-2016-ms.pdf|Использование графовой структуры в тематическом моделировании]]. 2016. ФИВТ МФТИ.
+# Илья Ирхин. [[Media:Irkhin2016msc.pdf|Сходимость численных методов вероятностного тематического моделирования]]. 2016. ФИВТ МФТИ.
+# Анжелика Сухарева. Оценивание качества выделения терминов в задаче классификации текстовых документов. 2016. ФУПМ МФТИ.
+# Евгения Вдовина. Отбор признаков для многоклассовой классификации символьных последовательностей. 2016. ФУПМ МФТИ.
+# [[Участник:Mapishev|Мурат Апишев]]. [[Media:Apishev2017MSc.pdf‎|Параллельная реализация аддитивно регуляризованного тематического моделирования и её применение для поиска этно-релевантного контента в социальных медиа]]. 2017. ВМК МГУ.
+# Юлия Лукашкина. [[Media:Lukashkina2017MSc.pdf‎|Оценивание устойчивости и полноты тематических моделей мультидисциплинарных текстовых коллекций]]. 2017. ВМК МГУ.
+# Андрей Шапулин. [[Media:Shapulin2017MSc.pdf‎|Классификация тем в вероятностных тематических моделях коллекций текстовых документов]]. 2017. ВМК МГУ.
+# Илья Голубев. Аддитивная регуляризация тематических моделей для выделения полных наборов тем в коллекциях текстовых документов. 2017. ФКН НИУ ВШЭ.
+# Роман Дербаносов. [[Media:Derbanosov2017MSc.pdf‎|Проблемы устойчивости и единственности стохастического матричного разложения]]. 2017. ФКН НИУ ВШЭ.
+# Илья Удалов. Библиотека с открытым исходным кодом для оптимизации и регуляризации линейных предсказательных моделей по большим выборкам данных. 2017. ФКН НИУ ВШЭ.
+# Ирина Ефимова. Иерархическая мультимодальная тематическая модель коллекции научно-популярных текстов. 2017. ФУПМ МФТИ.
+# Андрей Игнатов. [https://arxiv.org/abs/1704.02470 Улучшение качества цифровых снимков с помощью глубоких свёрточных нейронных сетей]. 2017. ФУПМ МФТИ.
+# Макар Краснопёров. Выделение именованных сущностей на основе текстов высокой похожести. 2017. ФИВТ МФТИ.
+# Александр Кузьмин. [[Media:Kuzmin2017MSc.pdf‎|Адаптивный выбор траектории регуляризации]]. 2017. ФИВТ МФТИ.
+# Руслан Камалов. [[Media:kamalov18msc.pdf‎|Нейросетевой подход к построению тематических моделей]]. 2018. ВМК МГУ.
+# Николай Попов. Гиперграфовые тематические модели транзакционных данных. 2018. ВМК МГУ.
+# Таснима Садекова. [[Media:sadekova18msc.pdf‎|Выделение мнений в тематических моделях новостных потоков]]. 2018. ВМК МГУ.
+# Никита Шаповалов. [[Media:shapovalov18msc.pdf‎|Интерпретируемые тематические модели новостных потоков для прогнозирования на финансовых рынках]]. 2018. ВМК МГУ.
+# Анастасия Янина. [[Media:ianina18msc.pdf‎|Тематический разведочный информационный поиск]]. 2018. ФИВТ МФТИ.
+# Илья Жариков. [[Media:Zharikov2018MasterThesis.pdf‎|Многомодальные тематические модели на гиперграфах]]. 2018. ФУПМ МФТИ.
+# Евгений Смирнов. [[Media:Smirnov2018MThesis.pdf‎|Тематическая сегментация диалогов контактного центра]]. 2018. ФУПМ МФТИ.
+# Роман Кулага. [[Media:KulagaMastersThesis.pdf|Классификация потока финансовых новостей с целью выявления динамики цен биржевых инструментов]]. 2018. ФУПМ МФТИ.
+# Артём Попов. [[Media:Popov19msc.pdf‎|Выделение множества тематик в неразмеченной коллекции диалогов]]. 2019. ВМК МГУ.
+# Вера Шишкина. [[Media:shishkina19msc.pdf|Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным]]. 2019. ФУПМ МФТИ.
+# Дарина Дементьева. [[Media:dementieva19msc.pdf|Агрегация и персонализация новостного текстового контента]]. 2019. ФУПМ МФТИ.
+# Пётр Остроухов. [[Media:ostroukhov19msc.pdf|Предобученные по Википедии тематические векторные представления слов]]. 2019. ФУПМ МФТИ.
+# Александр Никитин. [[Media:nikitin19msc.pdf|Иерархические тематические векторные представления слов в коллекциях текстов]]. 2019. НИУ ВШЭ.
+# Виктория Ходырева. [[Media:Khodyreva19msc.pdf|Автоматическое именование тем в вероятностном тематическом моделировании]]. 2019. ФКН НИУ ВШЭ.
+# Василий Алексеев. [[Media:Alekseev2020MSThesis.pdf|Поиск полного набора тем с помощью обучения нескольких тематических моделей]]. 2020. ФУПМ МФТИ.
+# Полина Потапова. [[Media:potapova20msc.pdf|Тематическое моделирование образовательных целей пользователей в системе дистанционного образования]]. 2020. ФУПМ МФТИ.
+# Даниил Фельдман. [[Media:Feldman2020MSThesis.pdf|Комбинирование фактов, семантических ролей и тональных слов в генеративной модели для поиска мнений]]. 2020. ФУПМ МФТИ.
+# Андрей Власов. [[Media:Vlasov2020MSThesis.pdf|Методы полуавтоматической суммаризации подборок научных статей]]. 2020. ФУПМ МФТИ.
+# Анастасия Павловская. [[Media:pavlovskaya20msc.pdf|Решение проблемы холодного старта при построении индивидуальной образовательной траектории с помощью тематического моделирования]]. 2020. ФИВТ МФТИ.
+# Олег Сомов. [[Media:somov20msc.pdf|Проектирование и разработка вопросно-ответной системы на основе графов знаний]]. 2020. ФИВТ МФТИ.
+# Кирилл Хрыльченко. [[Media:khrylchenko20msc.pdf|Обобщенные модальности в вероятностных тематических моделях для транзакционных данных]]. 2020. ВМК МГУ.
+# Никита Юдин. [[Media:yudin20msc.pdf|Вариационный вывод в нейронных стохастических дифференциальных уравнениях]]. 2020. ВМК МГУ.
+# Николай Герасименко. [[Media:gerasimenko20msc.pdf|Тематический поиск в коллекции юридических документов]]. 2020. МАИ.
+# Дарья Соболева. [[Media:soboleva21msc.pdf|Замена живой речи на синтетическое аудио для предсказания знаков пунктуации на устройстве пользователя]]. 2021. ВМК МГУ.
+# Николай Скачков. [[Media:skachkov20msc.pdf|Совместное обучение прямой и обратной модели машинного перевода]]. 2021. ВМК МГУ.
+# Вадим Кислинский. [[Media:kislinskiy21msc.pdf|Многокритериальная оптимизация в задаче персональных рекомендаций]]. 2021. ФПМИ МФТИ.
+# Евгений Козлинский. [[Media:kozlinskiy21msc.pdf|Методы тематической классификации коротких текстовых объявлений]]. 2021. ФПМИ МФТИ.
+# Анна Рогозина. [[Media:rogozina21msc.pdf|Обучение моделей распространения рисков по графам]]. 2021. ФПМИ МФТИ.
+# Светлана Крыжановская. [[Media:kryzhanovskaya22msc.pdf|Технология полуавтоматической суммаризации тематических подборок научных статей]]. 2022. ВМК МГУ.
+# Евгения Милюта. [[Media:miluta22msc.pdf|Языковые модели для обнаружения поляризации общественного мнения в новостном потоке]]. 2022. ВМК МГУ.
+# Виктор Панкратов. [[Media:pankratov23msc.pdf|Вероятностное тематическое моделирование неcбалансированных текстовых коллекций]]. 2023. ФПМИ МФТИ.
+# Арсений Веселов. [[Media:veselov23msc.pdf|Оценивание когнитивной сложности текста при помощи квантильного подхода и агрегирования]]. 2023. ВМК МГУ.
 ===Дипломные работы===
@@ Строка 801: / Строка 976: @@
 # Денис Старых. Алгоритмы генерации сигналов в потоке торговых данных. 2003. ВМК МГУ.
 # Денис Якубенков. Применение методов распознавания при построении и настройке имитационной модели биржевых торгов. 2003. ВМК МГУ.
-# Екатерина Егорова. Сравнительный анализ методов алгебраической коррекции для одного класса алгоритмов прогнозирования. 2005. ВМК МГУ.
+# Екатерина Егорова. [[Media:Egorova2005diploma.pdf|Сравнительный анализ методов алгебраической коррекции для одного класса алгоритмов прогнозирования]]. 2005. ВМК МГУ.
-# [[Участник:Даниил Каневский|Даниил Каневский]]. Генетические алгоритмы синтеза локальных базисов в алгебраическом подходе к проблеме распознавания. 2005. ВМК МГУ.
+# [[Участник:Даниил Каневский|Даниил Каневский]]. [[Media:Kanevskiy2005diploma.pdf|Генетические алгоритмы синтеза локальных базисов в алгебраическом подходе к проблеме распознавания]]. 2005. ВМК МГУ.
 # Алексей Колосков. Применение комбинаторных оценок обобщающей способности для повышения качества метрических алгоритмов классификации. 2005. ВМК МГУ.
 # Дмитрий Соколов. Сравнительный анализ обобщающей способности логических алгоритмов классификации. 2005. ВМК МГУ.
-# Людмила Романюха. Логические алгоритмы классификации в за-дачах кредитного скоринга и оценка риска кредитного портфеля банка. 2006. ВМК МГУ.
+# Людмила Романюха. Логические алгоритмы классификации в задачах кредитного скоринга и оценка риска кредитного портфеля банка. 2006. ВМК МГУ.
 # Ирек Ахуньянов. Применение модифицированного метода опорных векторов для построения метрических классификаторов. 2008. ВМК МГУ.
 # [[Участник:Венжега Андрей|Андрей Венжега]]. Отбор информативных признаков на выборках небольшой длины в задаче линейной регрессии с фиксированными ко-эффициентами. 2009. ВМК МГУ.
 # Максим Иванов. Эффективные метрические алгоритмы классификации на основе оптимизации профиля компактности. 2009. ВМК МГУ.
 # Алексей Медведев. Обобщающая способность логических закономерностей. 2009. ВМК МГУ.
-# [[Участник:Tsurko Varvara|Варвара Цурко]]. Логические алгоритмы классификации: проблема переобучения и применение в задачах медицинской диагностики. 2009. ВМК МГУ.
+# [[Участник:Tsurko Varvara|Варвара Цурко]]. [[Media:Tsurko-2009-ms.pdf|Логические алгоритмы классификации: проблема переобучения и применение в задачах медицинской диагностики]]. 2009. ВМК МГУ.
 # Григорий Чижик. Распознавание скрытых профилей пользователей и ресурсов в анализе клиентских сред. 2009. ВМК МГУ.
 # [[Участник:Gukov|Алексей Гуков]]. Оценки вероятности переобучения для некоторых связных семейств алгоритмов. 2010. ВМК МГУ.
-# [[Участник:Alina|Алина Карпинская]]. Методы построения неполносвязных нейронных сетей и их приложения в задачах прогнозирования. 2010. ВМК МГУ.
+# [[Участник:Alina|Алина Карпинская]]. [[Media:Karpinskaya-2010.pdf|Методы построения неполносвязных нейронных сетей и их приложения в задачах прогнозирования]]. 2010. ВМК МГУ.
 # [[Участник:Василий Ломакин|Василий Ломакин]]. Поиск взаимосвязей во временных рядах продаж. 2010. ВМК МГУ.
 # [[Участник:Slimper|Илья Решетняк]]. Комбинаторные оценки вероятности переобучения, учитывающие эффекты расслоения и связности в семействах алгоритмов. 2010. ВМК МГУ.
@@ Строка 821: / Строка 996: @@
 # [[Участник:Zhanna|Жанна Кожахметова]]. Построение карты дорог по данным о треках автотранспортных средств. 2011. ВМК МГУ.
 # [[Участник:Yury Logachev|Юрий Логачёв]]. Методы ранжирования в задаче текстовой релевантности. 2011. ВМК МГУ.
-# [[Участник:EPolezhaeva|Елена Полежаева]]. Инкрементные матричные разложения в задачах коллаборативной фильтрации. 2011. ВМК МГУ.
+# [[Участник:EPolezhaeva|Елена Полежаева]]. [[Media:Polezhaeva-2011-ms.pdf|Инкрементные матричные разложения в задачах коллаборативной фильтрации]]. 2011. ВМК МГУ.
 # Алёна Шевцова. Отбор информативных признаков в задачах медицинской диагностики. 2011. ВМК МГУ.
+# Александр Колесников. [[Media:Kolesnikov-2012-master-thesis.pdf|Прогнозирование вероятности кликов на новые рекламные объявления]]. 2012. ВМК МГУ.
+# Дмитрий Солодкин. Выявление закономерностей научного цитирования на основе вероятностных тематических моделей. 2012. ВМК МГУ.
+# Марина Дударенко. [[Media:Dudarenko-2012-masters-thesis.pdf|Методы предсказания информативности логических закономерностей]]. 2012. ВМК МГУ.
+# Ольга Исупова. Выявление тематических связей между документами методами латентного семантического анализа. 2012. ВМК МГУ.
+# Шаура Ишкина. [[Media:Ishkina-2013-master-thesis.pdf|Вероятность переобучения прямых цепей алгоритмов классификации]]. 2013. Мехмат МГУ.
+# Мария Василевская. Алгоритмы построения разреженных тематических моделей. 2013. Мехмат МГУ.
+# Кирилл Гаврилюк. [[Media:Gavrilyuk-2013-masters-thesis.pdf|Методы построения иерархических тематических моделей коллекции текстовых документов]]. 2013. ВМК МГУ.
+# Валентин Полежаев. [[Media:Polezhaev-2013-masters-thesis.pdf|Обучаемые методы извлечения наукометрической информации из коллекций научных публикаций]]. 2013. ВМК МГУ.
+# [[Участник:EvgSokolov|Евгений Соколов]]. [[Media:Sokolov-2013-masters-thesis.pdf|Комбинаторные оценки обобщающей способности и их применение для построения композиций линейных классификаторов]]. 2013. ВМК МГУ.
+# Иван Шанин. Методы анализа электрокардиограмм для ранней диагностики ишемической болезни. 2013. ВМК МГУ.
+# [[Участник:AnyaP|Анна Потапенко]]. [[Media:Potapenko-2014-masters-thesis.pdf|Лингвистическая регуляризация вероятностных тематических моделей]]. 2014. ВМК МГУ.
+# [[Участник:SdvAnd|Андрей Шадриков]]. [[Media:2015_517_ShadrikovAA.pdf|Алгоритмы неотрицательных матричных разложений для тематического моделирования]]. 2015. ВМК МГУ.
+# Тимур Исмагилов. [[Media:Ismagilov-2016-masters-thesis.pdf|Частично обучаемые вероятностные тематические модели коллекций научных текстов]]. 2016. ВМК МГУ.
 ===Кандидатские диссертации===
 # [[Участник:Andyray|Андрей Ивахненко]]. Комбинаторные оценки вероятности переобучения и их применение в логических алгоритмах классификации. МФТИ. 2010.
+# [[Участник:Гуз Иван|Иван Гуз]]. Комбинаторные оценки полного скользящего контроля и методы обучения монотонных классификаторов. ВЦ РАН. 2011.
+# [[Участник:Denis Kochedykov|Денис Кочедыков]]. Оценки обобщающей способности на основе характеристик расслоения и связности семейств функций. ВЦ РАН. 2011.
+# [[Участник:Павел Ботов|Павел Ботов]]. Оценки вероятности переобучения многомерных семейств алгоритмов классификации. ВЦ РАН. 2011.
+# [[Участник:Olman|Василий Лексин]]. Вероятностные модели в анализе клиентских сред. ВЦ РАН. 2011.
+# [[Участник:Pavel Kudinov|Павел Кудинов]]. [[Media:Kudinov2012phd.pdf|Адаптивные методы извлечения информации из статистических таблиц, представленных в текстовом виде]]. ВЦ РАН. 2012.
+# [[Участник:KiRiK|Кирилл Чувилин]]. [[Media:Chuvilin2013phd.pdf|Автоматический синтез правил коррекции текстовых документов формата LaTeX]]. ВЦ РАН. 2013.
+# [[Участник:Фрей Александр|Александр Фрей]]. [[Media:Frey2013phd.pdf|Теоретико-групповой подход в комбинаторной теории переобучения]]. ВЦ РАН. 2013.
+# [[Участник:Tolstikhin|Илья Толстихин]]. [[Media:Tolstikhin2014phd.pdf|Неравенства концентрации вероятностной меры в трансдуктивном обучении и PAC-Байесовском анализе]]. ВЦ РАН. 2014.
+# [[Участник:Riabenko|Евгений Рябенко]]. [[Media:Riabenko2014phd.pdf|Выбор функций потерь в задачах неотрицательного матричного разложения]]. ВЦ РАН. 2014.
+# [[Участник:Nkzh|Никита Животовский]]. [[Media:Zhivotovskiy2018phd.pdf|Минимаксные оценки риска в задачах статистического обучения]]. МФТИ, ИППИ РАН. 2018.
+# [[Участник:Настя Зухба|Анастасия Зухба]]. [[Media:Zukhba2018phd.pdf|Оценка вычислительной сложности задач отбора эталонных объектов и признаков]]. МФТИ. 2018.
+# Илья Трофимов. [http://www.frccsc.ru/diss-council/00207305/diss/list/trofimov_ie Разработка и обоснование методов параллельного покоординатного спуска для обучения обобщённых линейных моделей с регуляризацией]. ФИЦ ИУ РАН. 2019.
+# [[Участник:Anya|Анна Потапенко]]. [http://www.frccsc.ru/diss-council/00207305/diss/list/potapenko_aa Семантические векторные представления текста на основе вероятностного тематического моделирования]. ФИЦ ИУ РАН. 2019.
+# [[Участник:Mapishev|Мурат Апишев]]. [http://www.frccsc.ru/sites/default/files/docs/ds/002-073-05/diss/27-apishev/ds05-27-apishev_main.pdf Эффективная реализация алгоритмов тематического моделирования с аддитивной регуляризацией]. ФИЦ ИУ РАН. 2020.
+# Илья Ирхин. [http://www.frccsc.ru/sites/default/files/docs/ds/002-073-05/diss/29-irhin/ds05-29-irhin_main.pdf Единственность матричного разложения и сходимость регуляризованных алгоритмов в вероятностном тематическом моделировании]. ФИЦ ИУ РАН. 2020.
+# Виктор Булатов. [https://mipt.ru/upload/medialibrary/c25/bulatov_dissertation_topicnet_signature.pdf Методы оценивания качества и многокритериальной оптимизации тематических моделей в библиотеке TopicNet]. МФТИ. 2020.
+# Анастасия Янина. [https://mipt.ru/upload/medialibrary/a82/thesis_yanina_final.pdf Тематические и нейросетевые модели языка для разведочного информационного поиска]. МФТИ. 2022.
 == Cсылки ==
-* [http://www.ccas.ru/voron Домашняя страница К.&nbsp;В.&nbsp;Воронцова] на сайте ВЦ РАН.
+* [https://zen.yandex.ru/civideology Цивилизационная идеология] — канал на Яндекс.Дзен
-* [http://www.ccas.ru/voron/.index-eng.html K.Vorontsov homepage] — то же, там же, но на английском.
+* [http://www.ccas.ru/voron Домашняя страница К.&nbsp;В.&nbsp;Воронцова] на сайте ВЦ РАН (устарела)
-* [http://www.mathnet.ru/php/person.phtml?personid=42083&option_lang=rus К.&nbsp;В.&nbsp;Воронцов] — страница на математическом портале [http://www.mathnet.ru Math-Net.ru].
+* [http://www.ccas.ru/voron/.index-eng.html K.Vorontsov homepage] — то же, там же, но на английском
-* [http://www.mathnet.ru/php/person.phtml?personid=42083&option_lang=eng K.Vorontsov] — то же, там же, но на английском.
+* [http://www.mathnet.ru/php/person.phtml?personid=42083&option_lang=eng K.Vorontsov] — страница на mathnet.ru
-* [http://www.ccas.ru/frc FRC].
+* [http://www.ccas.ru/frc FRC]
-* [http://www.forecsys.ru Forecsys].
+* [http://www.forecsys.ru Forecsys]
+* [http://google.com/+KonstantinVorontsov google.com/+KonstantinVorontsov]
 == Мои подстраницы ==
 {{Служебная:Prefixindex/Участник:Vokov/}}
-----
-'''[[Служебная:EmailUser/Vokov|Написать письмо К.В.Воронцову]]'''.
 [[Категория:Страницы участников|V]]