Многомерное масштабирование
-
Многомерное масштабирование (MDS)
- Визуализация уровня сходства объектов в наборе данных
- Преобразование расстояний между объектами в конфигурацию точек в абстрактном пространстве
- Форма нелинейного уменьшения размерности
-
Типы MDS
- Классическое многомерное масштабирование (PCoA)
- Метрическое многомерное масштабирование (mMDS)
- Неметрическое многомерное масштабирование (NMDS)
- Обобщенное многомерное масштабирование (GMD)
-
Классическое многомерное масштабирование
- Минимизация функции потерь, называемой деформацией
- Использование двойного центрирования и собственных значений
-
Метрическое многомерное масштабирование
- Минимизация функции затрат, называемой стрессом
- Использование степенного преобразования расстояний
-
Неметрическое многомерное масштабирование
- Использование изотонической регрессии для непараметрической оценки
- Двойной процесс оптимизации: нахождение монотонного преобразования и оптимального расположения точек
-
Обобщенное многомерное масштабирование
- Расширение метрического многомерного масштабирования для неевклидовых пространств
- Поиск встраивания одной поверхности в другую с минимальными искажениями
-
Детали MDS
- Анализ данных с помощью матрицы расстояний
- Поиск векторов в N-мерном пространстве для сохранения расстояний
- Различные подходы к определению векторов, включая оптимизацию и аналитические методы
-
Процедура MDS
- Формулировка проблемы и выбор переменных для сравнения
- Минимизация функции затрат с помощью численной оптимизации или аналитических методов
-
Получение входных данных
- Респондентам задаются вопросы о сходстве продуктов по 7-балльной шкале Лайкерта.
- Количество вопросов зависит от количества брендов.
-
Подходы к сбору данных
- «Данные о восприятии: прямой подход» использует 7-балльную шкалу Лайкерта.
- «Данные о восприятии: производный подход» использует шкалу семантического дифференциала.
- «Метод сбора данных о предпочтениях» спрашивает о предпочтениях, а не о сходстве.
-
Запуск статистической программы MDS
- Программное обеспечение доступно в различных пакетах статистического программного обеспечения.
- Метрические MDS обрабатывают данные об интервалах или уровнях отношения.
- Нетирические MDS обрабатывают порядковые данные.
-
Определение количества измерений
- Исследователь должен выбрать количество измерений для создания.
- Решения с меньшими размерами легче интерпретировать и визуализировать.
- Инструменты выбора модели помогают сбалансировать недостаточную и избыточную подгонку.
-
Сопоставление результатов и определение параметров
- Статистическая программа сопоставляет результаты в двумерном пространстве.
- Близость продуктов указывает на их сходство или предпочтение.
- Субъективное суждение о соответствии параметров поведения системы.
-
Проверка результатов на надежность и валидность
- R-квадрат определяет долю дисперсии, учитываемую процедурой MDS.
- R-квадрат 0,6 считается минимально допустимым уровнем.
- Другие тесты включают стресс-тесты Kruskal, тесты с разделением данных и тесты на стабильность данных.
-
Предоставление полного отчета о результатах
- Указать измерение расстояния и достоверность.
- Указать алгоритм, начальную конфигурацию, количество запусков, оценку размерности и другие параметры.
-
Реализации MDS
- ELKI, MATLAB, R и scikit-learn предлагают реализации MDS.
-
Связанные методы
- Кластеризация данных, t-распределенное стохастическое вложение соседей, факторный анализ, дискриминантный анализ, уменьшение габаритов, геометрия расстояния, определитель Кэли–Менгера, отображение Сэммона, иконография корреляций.