Переоснащение
- Переобучение – это проблема в машинном обучении, когда модель слишком хорошо адаптируется к обучающим данным, но хуже работает на невидимых данных.
- Переобучение может привести к низкой производительности набора данных для проверки и другим негативным последствиям.
- Оптимальная функция требует проверки на больших или совершенно новых наборах данных.
- Существуют методы, такие как минимальное связующее дерево и время жизни корреляции, для уменьшения риска переобучения.
- Недостаточное соответствие – это обратная сторона чрезмерного соответствия, означающая, что статистическая модель или алгоритм машинного обучения слишком упрощены.
- Устранение неполноценности включает увеличение сложности модели, использование другого алгоритма, увеличение объема обучающих данных, регуляризацию и ансамблевые методы.
- Мягкое переобучение описывает феномен статистической модели, которая хорошо обобщает невидимые данные, даже если она была идеально подогнана к зашумленным обучающим данным.
Полный текст статьи: