Локальный фактор выброса
-
Основы обнаружения выбросов
- Выбросы в данных могут указывать на аномалии или ошибки.
- Локальный подход LOF используется для обнаружения выбросов в наборах данных.
-
Алгоритм LOF
- LOF основан на вычислении расстояния между точками и их соседями.
- Локальные плотности достижимости сравниваются с плотностями соседей.
- Значение LOF ~ 1 указывает на сопоставимость с соседями, < 1 — на более высокую плотность, > 1 — на меньшую плотность.
-
Преимущества и недостатки
- LOF может идентифицировать выбросы, которые не являются выбросами в других областях.
- Геометрическая интуиция применима только к низкоразмерным пространствам.
- LOF хорошо работает в различных задачах, включая сетевые вторжения и классификацию данных.
-
Расширения и улучшения
- Существуют расширения LOF для улучшения качества обнаружения и уменьшения чувствительности к параметрам.
- LoOP — метод, основанный на LOF, с меньшей чувствительностью к выбору параметра k.
- Предлагаются методы нормализации оценок выбросов LOF для удобства использования.
-
Рекомендации
- Статья содержит список рекомендаций по цитированию и форматированию библиографических описаний.