Межотраслевой стандартный процесс интеллектуального анализа данных

Межотраслевой стандартный процесс интеллектуального анализа данных Обзор CRISP-DM CRISP-DM — это открытая стандартная модель процесса для интеллектуального анализа данных.  Модель […]

Межотраслевой стандартный процесс интеллектуального анализа данных

  • Обзор CRISP-DM

    • CRISP-DM — это открытая стандартная модель процесса для интеллектуального анализа данных. 
    • Модель широко используется в аналитической сфере. 
  • История и развитие

    • CRISP-DM был разработан в 1996 году и финансировался Европейским союзом в рамках ESPRIT. 
    • Проект включал пять компаний с различным опытом в области анализа данных. 
    • Первая версия методологии была представлена в 1999 году и опубликована в 2000 году. 
    • В период с 2006 по 2008 год была создана версия CRISP-DM 2.0, но дальнейшие обновления не были завершены. 
  • Основные этапы и уроки

    • CRISP-DM состоит из шести основных этапов: понимание бизнеса, данных, подготовка данных, моделирование, оценка и развертывание. 
    • Фазы процесса не являются строго последовательными, и часто требуется переход от одной к другой. 
    • Процесс анализа данных продолжается после развертывания решения, и опыт может привести к новым бизнес-вопросам. 
  • Популярность и критика

    • CRISP-DM является ведущей методологией, используемой отраслевыми аналитиками. 
    • В опросах 2002-2014 годов CRISP-DM был признан стандартом де-факто для разработки проектов анализа данных. 
    • В 2024 году Harvard Business Review представил обновленный фреймворк bizML для бизнес-персонала. 
  • Обновления и альтернативы

    • В 2015 году IBM представила новую методологию ASUM-DM, которая расширяет и совершенствует CRISP-DM. 
    • В 2006-2008 годах были попытки обновить CRISP-DM, но они не привели к созданию новой версии. 
    • В 2009 году CRISP-DM был назван «стандартом де-факто» для разработки проектов анализа данных и обнаружения знаний. 
    • В 2008 году было проведено сравнение CRISP-DM с SEMMA, но SEMMA не является методологией анализа данных, а представляет собой набор инструментов SAS Enterprise Miner. 

Полный текст статьи:

Межотраслевой стандартный процесс интеллектуального анализа данных — Википедия

Оставьте комментарий

Прокрутить вверх