Набор данных о цветке ириса
-
История и использование набора данных ириса
- Набор данных ириса был использован Рональдом Фишером для демонстрации линейного дискриминантного анализа в 1936 году.
- Эдгар Андерсон собрал данные о морфологической изменчивости трех видов ириса для количественной оценки.
- Набор данных включает 50 образцов каждого вида ириса с измеренными четырьмя признаками.
-
Применение в машинном обучении
- Набор данных стал классическим примером для методов статистической классификации, таких как методы опорных векторов.
- В кластерном анализе набор данных не используется широко, так как содержит два кластера с очевидным разделением.
- Набор данных иллюстрирует разницу между контролируемыми и неконтролируемыми методами анализа данных.
-
Неконтролируемый анализ главных компонент
- Набор данных может быть разделен на нелинейные и ветвящиеся главные компоненты.
- Построение «карты метро» позволяет визуализировать разделение видов ириса.
- Набор данных можно разделить на узлы дерева с помощью неконтролируемых методов анализа главных компонент.
-
Доступность и использование
- Набор данных широко используется для обучения начинающих в области машинного обучения.
- Набор данных включен в R base и библиотеку машинного обучения scikit-learn.
- Существует несколько версий набора данных, доступных для скачивания.
-
Примеры кода
- Приведены примеры кода на R и Python для визуализации данных ириса.
Полный текст статьи: