Оглавление
СЕММА
-
Определение и применение SEMMA
- SEMMA – это аббревиатура, обозначающая “Образец”, “Исследование”, “Модификация”, “Моделирование” и “Оценка”.
- Разработана институтом SAS для интеллектуального анализа данных.
- Является логической организацией инструментов для выполнения основных задач анализа данных.
-
Фон и развитие
- Возникла потребность в стандартизированной методологии для анализа данных в различных отраслях.
- CRISP-DM направлен на создание нейтральной методологии, в то время как SAS предложила свой образец.
-
Фазы SEMMA
- “Образец” включает выборку данных и их разбиение.
- “Исследование” включает понимание данных через визуализацию и выявление взаимосвязей.
- “Модифицировать” включает выбор, создание и преобразование переменных для моделирования.
- “Модель” фокусируется на применении методов моделирования для создания моделей.
- “Оценивать” оценивает надежность и полезность моделей.
-
Критика и применение
- SEMMA фокусируется на задачах моделирования, игнорируя бизнес-аспекты.
- Предназначена для использования с программным обеспечением SAS Enterprise Miner, что может быть ограничено за его пределами.
- Для эффективной выборки данных требуется глубокое понимание бизнес-аспектов.
-
Дополнительная информация
- Упоминается межотраслевой стандартный процесс интеллектуального анализа данных CRISP-DM.
- Статья содержит рекомендации по использованию SEMMA.