Оглавление
Изучение сходства
-
Основы обучения сходству
- Обучение сходству – это область контролируемого машинного обучения, связанная с регрессией и классификацией.
- Цель – изучение функции сходства, измеряющей взаимосвязь между объектами.
- Применяется в ранжировании, рекомендательных системах и других областях.
-
Настройка обучения
- Существуют четыре общие настройки для обучения сходству.
- Билинейная форма используется для моделирования функции сходства.
- Сиамская сеть – это модель глубокой сети с общим доступом к параметрам, которая эффективна при большом количестве данных.
-
Метрическое обучение
- Метрическое обучение связано с обучением функции расстояния между объектами.
- Алгоритмы метрического обучения игнорируют условие идентичности неразличимых объектов и изучают псевдометрики.
- Псевдометрика может быть переписана как евклидово расстояние между преобразованными векторами признаков.
-
Приложения
- Обучение сходству используется в поиске информации, в том числе для ранжирования, проверки лица и рекомендательных систем.
- Метрическое обучение является этапом предварительной обработки для многих подходов машинного обучения.
-
Масштабируемость
- Обучение метрике и подобию масштабируется квадратично с увеличением размерности пространства.
- Существуют методы, такие как HDSL и COMET, которые позволяют масштабировать до высоких размерностей.
-
Программное обеспечение
- metric-learn – это бесплатная библиотека на Python для контролируемого и слабо контролируемого обучения подобию и метрике.
- API metric-learn совместим с scikit-learn.
- OpenMetricLearning – это фреймворк на Python для обучения и валидации моделей.
-
Дополнительная информация
- Для получения дополнительной информации рекомендуется ознакомиться с обзорами по изучению показателей и сходства.
- Упоминаются другие связанные области машинного обучения, такие как метод ядра и скрытый семантический анализ.