БММО (курс лекций)/2013осень/Задание 2

Материал из MachineLearning.

Версия от 20:09, 30 ноября 2013; Sbos (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск
Описание задания в настоящий момент не завершено. Просьба дождаться окончания работ


Содержание


Начало выполнения задания: 3 ноября 2013 г.
Срок сдачи: ?? 2013 г., 23:59. За каждый день просрочки оценка за задание будет снижаться на 0.1 балла.

Анализ текстов на естественном языке с помощью скрытого размещения Дирихле

В рамках данного задания студентам предлагается самостоятельно провести исследование по применению метода скрытого размещения Дирихле (LDA) на реальном корпусе текстов и получить интерпретируемые результаты в виде описаний тематик (топиков). Используя готовую реализацию LDA, необходимо изучить зависимость меры качества от параметров модели и получить качественные выводы об их влиянии как на формальные критерии качества, так и на субъективные, подразумевающие интерпретируемость полученных тематик с точки зрения человека.

В качестве формального критерия качества используется правдоподобие тестовой выборки p(\mathbf{w}_{\text{test}} | \mathbf{w}_{\text{train}}) (см. напр. конспект лекции). Рекомендуется выбрать реализацию LDA, входящую в состав пакета Mallet, однако студент может выбрать и любую другую на свой страх и риск.

Распределение студентов по вариантам

Оформление задания

Результаты выполнения задания в виде отчета в формате PDF следует присылать на адрес sbos.net AT gmail.com с темой «[БММО13] Задание 2 <ФИО>». Убедительная просьба присылать выполненное задание только один раз с окончательным вариантом.

Личные инструменты