Наборы данных для обучения, валидации и тестирования
- Набор данных используется для обучения алгоритмов машинного обучения.
- Обучающий набор данных используется для подбора параметров модели.
- Набор проверочных данных используется для настройки гиперпараметров модели.
- Тестовый набор данных используется для оценки соответствия окончательной модели набору обучающих данных.
- Термины “набор тестов” и “набор проверки” иногда используются взаимозаменяемо.
- Перекрестная проверка используется для получения более стабильных результатов и использования всех ценных данных для обучения.
- Ошибки при обучении алгоритмов являются основной причиной ошибочных выходных данных.
Полный текст статьи: