Оглавление
Межотраслевой стандартный процесс интеллектуального анализа данных
-
Обзор CRISP-DM
- CRISP-DM – это открытая стандартная модель процесса для интеллектуального анализа данных.
- Модель широко используется в аналитической сфере.
-
История и развитие
- CRISP-DM был разработан в 1996 году и финансировался Европейским союзом в рамках ESPRIT.
- Проект включал пять компаний с различным опытом в области анализа данных.
- Первая версия методологии была представлена в 1999 году и опубликована в 2000 году.
- В период с 2006 по 2008 год была создана версия CRISP-DM 2.0, но дальнейшие обновления не были завершены.
-
Основные этапы и уроки
- CRISP-DM состоит из шести основных этапов: понимание бизнеса, данных, подготовка данных, моделирование, оценка и развертывание.
- Фазы процесса не являются строго последовательными, и часто требуется переход от одной к другой.
- Процесс анализа данных продолжается после развертывания решения, и опыт может привести к новым бизнес-вопросам.
-
Популярность и критика
- CRISP-DM является ведущей методологией, используемой отраслевыми аналитиками.
- В опросах 2002-2014 годов CRISP-DM был признан стандартом де-факто для разработки проектов анализа данных.
- В 2024 году Harvard Business Review представил обновленный фреймворк bizML для бизнес-персонала.
-
Обновления и альтернативы
- В 2015 году IBM представила новую методологию ASUM-DM, которая расширяет и совершенствует CRISP-DM.
- В 2006-2008 годах были попытки обновить CRISP-DM, но они не привели к созданию новой версии.
- В 2009 году CRISP-DM был назван “стандартом де-факто” для разработки проектов анализа данных и обнаружения знаний.
- В 2008 году было проведено сравнение CRISP-DM с SEMMA, но SEMMA не является методологией анализа данных, а представляет собой набор инструментов SAS Enterprise Miner.