T-распределенное стохастическое вложение соседей
-
Основы t-SNE
- t-SNE — это статистический метод для визуализации многомерных данных в двух или трех измерениях.
- Он основан на стохастическом внедрении соседей и использует t-распределение для моделирования сходства между объектами.
-
Процесс t-SNE
- t-SNE строит распределение вероятностей для пар объектов и минимизирует расхождение Кульбака-Лейблера между этими распределениями.
- Он может быть адаптирован для использования различных метрик подобия, включая евклидово расстояние.
-
Применение t-SNE
- t-SNE используется в различных областях, включая геномику, компьютерную безопасность, анализ музыки и биоинформатику.
- Однако результаты могут быть искажены, поэтому требуется интерактивное исследование параметров.
-
Время и пространство выполнения
- t-SNE выполняется за линейное время и требует линейного пространства.
-
Детали алгоритма
- Алгоритм начинается с вычисления вероятностей сходства между объектами.
- Затем определяется пропускная способность гауссовых ядер, которая адаптируется к плотности данных.
- Наконец, выполняется оптимизация расположения точек на карте, отражающей сходство между входными данными.
-
Программное обеспечение
- Rtsne, ELKI, scikit-learn и Tensorboard — это пакеты, которые реализуют t-SNE в различных языках программирования.
-
Рекомендации
- Статья содержит внешние ссылки и коллекции ссылок на реализации t-SNE.