Участник:Andyray/Курс по датамайнингу
Материал из MachineLearning.
Содержание |
О курсе
Чем мы будем заниматься? Форма отчетности. Ученические проекты. Что такое CRISP-DM? История создания (основатели, предпосылки). Основные шаги методологии.
Предполагаемая форма занятий будет следующей. Группа разбивается на 2-3 подгруппы. Каждая подгруппа должна предоставить в конце семестра действующий проект. Проектом называется решение задачи из области анализа данных проведенное от постановки задачи и до внедрения.
Введение в CRISP-DM
Подробное рассмотрение шагов методологии.
Практика 1. Выбор задачи.
Выбор задачи для самостоятельного проекта в течении семестра. Для выбора задачи будет приглашено несколько экспертов, владельцев реальных задач из области анализа данных. Каждый из них выступает с рассказом о текущих проблемах его бизнеса. Студенты задают вопросы. Результатом данного собеседования должна стать концепция проекта для каждого из представителей бизнеса.
После общего собеседования, можно провести частные собеседования по группам для того что бы дать возможность получить конкурентное преимущество задав более глубокие вопросы.
Понимание бизнеса
Понимание бизнеса (Business Understanding). Кейсы бизнес-проблем и их сведение к корректным постановкам задач анализа данных. ОТП, НСС, Goods4Cast
Понимание данных
Понимание данных (Data Understanding).
Подготовка данных
Подготовка данных (Data Preparation). Находки при подготовке данных.
- НСС - создание системы шифрации признаков
Практика 2. Обсуждение текущих дел в проектах.
Промежуточное подведение итогов по поставленным задачам. Отчет студентов.
Моделирование
Моделирование (Modeling). Проблемы подбора моделей. Как быстро выбрать модель. Что делать если модель не подошла?
Оценка
Оценка (Evaluation)
Развертывание
Развертывание (Deployment)
Практика 3. Отчет о текущем положении дел.
Второе промежуточное занятие. Отчет о текущем положении дел. Обсуждение задач и возникших проблем.
Защита проектов 1
Защита проектов 1.
Защита проектов 2
Защита проектов 2.