Вики

Q-обучение

Q-обучение Q-learning – алгоритм обучения с подкреплением, основанный на максимизации ожидаемого вознаграждения.  Алгоритм использует таблицу Q для хранения значений действий […]