Оглавление
К-медоиды
-
Проблема k-медоидов
- Кластеризация, аналогичная k-средним, но с выбором фактических точек данных в качестве центров кластеров.
- Обеспечивает большую интерпретируемость центров кластеров по сравнению с k-средними.
- Может использоваться с различными мерами различия, но обычно требует евклидова расстояния.
- Более устойчива к шуму и выбросам по сравнению с k-средними.
-
Алгоритмы k-медоидов
- NP-сложно точно решить, существуют эвристические решения.
- Разделение вокруг медоидов (PAM) использует жадный поиск и может быть оптимизировано.
- Сложность выполнения PAM на итерацию составляет O(k(n−k)2), но может быть уменьшена до O(n2) с помощью FastPAM.
- Существуют итерационные методы Вороного и иерархическая кластеризация с “медоидной связью”, но они имеют худшие результаты по сравнению с PAM.
-
Программное обеспечение для k-медоидов
- Различные языки программирования и пакеты предоставляют реализации алгоритмов k-медоидов, включая PAM, CLARA, CLARANS и другие.
- Некоторые пакеты предлагают улучшения и альтернативные подходы к решению задачи кластеризации k-медоидов.