Оглавление
Индекс Жаккарда
-
Определение и применение индекса Жаккарда
- Индекс Жаккарда используется для оценки сходства между двумя наборами данных.
- Он вычисляется как отношение числа общих элементов к общему числу элементов в наборах.
- Индекс Жаккарда может быть использован для оценки сходства между изображениями, текстами и другими данными.
-
История и развитие
- Индекс Жаккарда был предложен в 1901 году французским математиком Морисом Жакомкардом.
- Он был адаптирован для различных областей, включая биологию, лингвистику и компьютерную науку.
- В информатике он используется для оценки сходства между бинарными векторами и для классификации изображений.
-
Теоретические основы
- Индекс Жаккарда основан на теории множеств и теории вероятностей.
- Он является оптимальным способом выравнивания случайных величин, максимизируя вероятность столкновения.
- Теорема утверждает, что ни один метод выборки не может обеспечить большего количества коллизий без уменьшения их количества на других парах.
-
Сходство и дистанция Танимото
- В литературе и интернете встречаются различные формы функций, описываемых как сходство по Танимото и расстояние по Танимото.
- Большинство из них являются синонимами понятий “сходство по Жаккарду” и “расстояние по Жаккарду”, но некоторые математически различаются.
- В статье “коэффициент сходства” представлен на растровых изображениях, где каждый бит массива представляет наличие или отсутствие характеристики у моделируемого объекта.
-
Свойства и использование
- Индекс Жаккарда не всегда сохраняет неравенство треугольника, что отличает его от метрики расстояния.
- В матрицах путаницы для бинарной классификации индекс Жаккарда может быть выражен через количество истинно положительных, ложноположительных и ложноотрицательных результатов.
-
Рекомендации и дальнейшее чтение
- В статье приведены ссылки на конспекты лекций и внешние ресурсы для дальнейшего изучения индекса Жаккарда.