Reinforcement learning

Вики

Самостоятельная игра

Самостоятельная игра Основы машинного обучения Машинное обучение – это процесс обучения алгоритмов для выполнения задач, которые ранее выполнялись людьми.  Обучение

Вики

Q-обучение

Q-обучение Q-learning – алгоритм обучения с подкреплением, основанный на максимизации ожидаемого вознаграждения.  Алгоритм использует таблицу Q для хранения значений действий

Вики

Обучение с подкреплением

Обучение с подкреплением Марковские процессы принятия решений используются для моделирования поведения агентов в сложных системах.  Оптимальная политика определяется как максимизация

Прокрутить вверх