СЕММА
-
Определение и применение SEMMA
- SEMMA — это аббревиатура, обозначающая «Образец», «Исследование», «Модификация», «Моделирование» и «Оценка».
- Разработана институтом SAS для интеллектуального анализа данных.
- Является логической организацией инструментов для выполнения основных задач анализа данных.
-
Фон и развитие
- Возникла потребность в стандартизированной методологии для анализа данных в различных отраслях.
- CRISP-DM направлен на создание нейтральной методологии, в то время как SAS предложила свой образец.
-
Фазы SEMMA
- «Образец» включает выборку данных и их разбиение.
- «Исследование» включает понимание данных через визуализацию и выявление взаимосвязей.
- «Модифицировать» включает выбор, создание и преобразование переменных для моделирования.
- «Модель» фокусируется на применении методов моделирования для создания моделей.
- «Оценивать» оценивает надежность и полезность моделей.
-
Критика и применение
- SEMMA фокусируется на задачах моделирования, игнорируя бизнес-аспекты.
- Предназначена для использования с программным обеспечением SAS Enterprise Miner, что может быть ограничено за его пределами.
- Для эффективной выборки данных требуется глубокое понимание бизнес-аспектов.
-
Дополнительная информация
- Упоминается межотраслевой стандартный процесс интеллектуального анализа данных CRISP-DM.
- Статья содержит рекомендации по использованию SEMMA.