Выбор функции
-
Основы выбора признаков
- Выбор признаков — это процесс выбора подмножества признаков из полного набора признаков.
- Выбор признаков влияет на точность классификации и может быть выполнен с помощью различных методов.
-
Методы выбора признаков
- Методы выбора признаков включают выбор признаков на основе энтропии, взаимной информации и других критериев.
- Выбор признаков может быть основан на использовании различных метрик, таких как корреляция и взаимная информация.
-
Выбор признаков на основе энтропии
- Энтропия используется для оценки избыточности признаков и может быть вычислена с помощью формулы Шеннона.
- Выбор признаков на основе энтропии включает методы, такие как информационный критерий Акаике и байесовский информационный критерий.
-
Выбор признаков на основе взаимной информации
- Взаимная информация используется для оценки избыточности между признаками и классификацией.
- Методы выбора признаков на основе взаимной информации включают информационный критерий Кульбака-Лейблера и метод максимального правдоподобия.
-
Выбор признаков на основе условной взаимной информации
- Условная взаимная информация учитывает взаимодействие признаков и может быть использована для избегания избыточности.
- Методы выбора признаков на основе условной взаимной информации включают метод максимального правдоподобия и метод максимального правдоподобия с регуляризацией.
-
Выбор признаков на основе критерия независимости Гильберта-Шмидта
- Критерий независимости Гильберта-Шмидта используется для оценки независимости признаков и может быть применен в задачах с большой размерностью и малыми выборками.
-
Выбор корреляционного признака
- Корреляционный признак оценивает подмножества признаков на основе корреляций между признаками и классификацией.
- Методы выбора корреляционного признака включают использование различных показателей корреляции, таких как минимальная длина описания и симметричная неопределенность.
-
Упорядоченные деревья
- Упорядоченные деревья наказывают за использование переменных, выбранных в предыдущих узлах, для разделения текущего узла.
- Регуляризованные деревья являются эффективными с вычислительной точки зрения и могут обрабатывать числовые и категориальные характеристики, а также взаимодействия и нелинейности.
- Пересказана только часть статьи. Для продолжения перейдите к чтению оригинала.