Наивный байесовский классификатор
-
Основы Наивного Байеса
- Наивный Байес — простой алгоритм классификации, основанный на вероятностях.
- Используется для классификации объектов с дискретными признаками.
- Не требует сложных предположений о распределении признаков.
-
Применение в классификации документов
- Используется для классификации текстов на основе частоты встречаемости слов.
- Часто применяется для фильтрации спама.
-
Оценка параметров распределения
- Для оценки параметров распределения признаков используются непараметрические модели.
- Предположения о распределении признаков называются «моделью событий».
-
Методы обработки непрерывных значений
- Для непрерывных данных используются гауссовы распределения и биннинг.
- Оценка плотности ядра может повысить точность классификатора.
-
Многочленный Наивный Байес
- Используется для классификации документов, где признаки представляют частоты слов.
- Превращает классификацию в линейный классификатор в логарифмическом пространстве.
- Включает поправку на малую выборку для предотвращения проблем с нулевыми вероятностями.
-
Наивный Байес Бернулли
- Используется для задач классификации документов, где признаки являются независимыми бинарными переменными.
- Вероятность классификации документа определяется как произведение вероятностей наличия или отсутствия терминов.
- Пересказана только часть статьи. Для продолжения перейдите к чтению оригинала.