CRISP-DM/Business Understanding

Материал из MachineLearning.

Перейти к: навигация, поиск

В данной фазе необходимо сфокусироваться на понимании целей проекта и требований со стороны бизнеса. Результатом данной фазы является постановка задачи в терминах анализа данных и предварительный план по ее решению.

Содержание

Определить бизнес цели (Determine business objectives)

Первое, на чем должен полностью сфокусироваться аналитик при определении безнес-целей, - понять желание заказчика. Часто заказчик ставит противоречивые цели и ограничения, и нужно сформулировать их правильно. Целью аналитика является выделение важных факторов, которые могут повлиять на результаты проекта. Пренебрежение этим этапом может привести к затрате большого количества сил на ответы на неправильно заданные вопросы.

Бэкграунд проекта (Background)

В начале проекта следует записать информацию, относящуюся к бизнес-целям заказчика.

Цели бизнеса (Business objectives)

Опишите основные цели заказчика с точки зрения бизнеса. Кроме основных целей бизнеса обычно также существуют связанные с бизнесом вопросы, с которыми заказчик может к Вам обратиться. Например, основной целью бизнеса может быть удержание текущих покупателей, с помощью предсказания возможности их оттока к конкурентам. Примерами связанных с бизнесом вопросов могут послужить следующие вопросы: "Как основные каналы информации (например, использование банкомата, посещение филиала, интернет), которые использует клиент банка, повлияют на его решение о переходе к конкурентам?" или "Насколько сильно понижение затрат на обслуживание банкоматов уменьшит число самых ценных клиентов?"

Условия успешности бизнеса (Business success criteria)

Опишите условия успешного ведения бизнеса или производительности проекта с точки зрения этого бизнеса. Возможность этого описания достаточно специфична и иногда может быть объективно измерена, например, как уменьшение оттока клиентов до определенного уровня или характеризоваться как нечто общее и субъективное: "предоставьте полезные наблюдения о взаимосвязях". В последнем случае важно выяснить, кто выполняет субъективное решение о том, насколько успешен бизнес.

Оценить ситуацию (Assess situation)

Данная задача включает в себя более подробное изучение ресурсов, ограничений, допущений и других факторов, которые следует учитывать при определении цели анализа данных и составлении плана проекта. В предыдущей задаче вашей целью было быстро разобраться в сути поставленной задачи. Сейчас же, вы хотите конкретизировать детали.

Анализ ресурсов (Inventory of resources)

Перечислите ресурсы, имеющиеся в проекте, включая: персонал (бизнес-эксперты, эксперты по данным, технические специалисты, специалисты по анализу данных), данные (выгруженные данные, данные хранилища, операционные данные), вычислительные ресурсы (аппаратные платформы) и программное обеспечение (инструменты интеллектуального анализа данных и другие подходящие программы).

Требования, предположения, ограничения (Requirements, assumptions and constraints)

Перечислите все требования к проекту, включая график выполнения, ясность и качество результатов, безопасность, а также правовые вопросы. Также убедитесь в результате, что имеете право на использование данных.

Перечислите предположения, сделанные в рамках проекта. Это могут быть предположения о данных, которые можно проверить в процессе анализа данных, но также могут включать непроверяемые идеи о бизнесе, на котором основывается проект. Последние особенно важны, если они формируют условия на достоверность результатов.

Перечислите ограничения, налагаемые на проект. Это могут быть ограничения на наличие ресурсов, но также могут включать технологические ограничения, такие как размер данных, которые целесообразно использовать для моделирования.

Риски (Risks and contingencies)

Перечислите риски и события, которые могут отсрочить проект или привести его к неудачному завершению. Перечислите соотвествующие чрезвычайные планы; какие меры должны быть предприняты в рисковой ситуации.

Терминология (Terminology)

Составьте глоссарий терминологии важной для проекта. Можно выделить две важные составляющие:

(1) Словарь бизнес-терминов, которые формируют доступное для проекта понимание бизнеса.

(2) Словарь терминов анализа данных, иллюстрированные примерами, относящимися к бизнес-задаче, о которой идет речь.

Оценка доходности (Costs and benefits)

Проведите анализ затрат и дохода проекта, который сравнивает стоимость проекта с потенциальной прибылью бизнеса в случае успешной реализации. Сравнение должно быть как можно более конкретным, к примеру, с использованием денежно-кредитных мер в торговой ситуации.

Определить цели анализа данных (Determine data mining goals)

Бизнес-цель определяет задачу в терминах бизнеса. Цель анализа данных определяет задачу в технических терминах. Пример бизнес-цели: "Увеличить торговлю по каталогам для текущих клиентов." Пример цели анализа данных: "Зная количество покупок за последние три года, демографическую информацию (возраст, зарплату, город и т.п.) и цену продукта, предсказать, сколько изделий приобретет покупатель".

Цели анализа данных (Data mining goals)

Описать ожидаемые результаты проекта, которые приведут к достижению бизнес-целей.

Критерий успеха анализа данных (Data mining success criteria)

Определите критерий успешного исхода проекта в технических терминах. К примеру, определенный уровень точности прогноза или склонности к покупке профиля с заданным уровнем "подъема". Как и в случае условий успешного бизнеса, возможно будет необходимо описать критерии в субъективных условиях, в этом случае лицо или лица, принимающие субъективные решения, должны быть определены.

Составить план проекта (Produce project plan)

Опишите план по достижению целей анализа данных и, тем самым, бизнес-целей. План должен содержать предполагаемый набор шагов, которые должны быть выполнены в течение остальной части проекта, в том числе первоначальный выбор средств и методов.

План проекта (Project plan)

Перечислите этапы которые должны быть выполнены в проекте, укажите длительность, необходимые ресурсы, входы, выходы, и зависимости. Где это возможно детализируйте крупномасштабные итерации в процессе интеллектуального анализа данных, например для итераций фаз моделирования и оценки.

В рамках плана проекта также важно проанализировать зависимость между планированием и риском. Отметьте результаты анализа в плане, в идеале с действиями и рекомендациями, если риски реализуются.

Примечание: план проекта содержит подробный план для каждой фазы. Например, решите на этом этапе какая стратегия оценки будет использована в стадии оценки.

План проекта является динамичным документом в том смысле, что в конце каждого этапа необходим пересмотр текущего прогресса и обновление плана проекта. Пункты по пересмотру плана так же включаются в план.

Первоначальная оценка инструментов и методов (Initial assessment of tools and techniques)

В конце первого этапа, также выполняется предварительная оценка инструментов и методов. Здесь вы выбираете инструменты интеллектуального анализа данных, которые, например, поддерживают разные методы для различных стадий процесса. Важно оценить инструменты и методы в начале процесса, так как выбор средств и методов влияет на весь проект.

Ссылки

Личные инструменты