Оглавление [Скрыть]
Выбор, основанный на вознаграждении
-
Основы отбора на основе вознаграждения
- Отбор на основе вознаграждения используется в эволюционных алгоритмах для выбора решений для рекомбинации.
- Вероятность выбора человека пропорциональна его совокупному вознаграждению.
- Вознаграждение включает индивидуальное вознаграждение и вознаграждение, унаследованное от родителей.
-
Применение отбора на основе вознаграждения
- Используется в Multi-armed bandit для оптимизации нескольких целей.
- Новорожденный и его родители получают вознаграждение в зависимости от его выбора для новой популяции.
-
Определение вознаграждения
- Вознаграждение может быть равно единице, если индивид выбран для новой популяции.
- Может быть основано на рангах индивида в популяции или на его вкладе в улучшение качества популяции.
- Возможно смягчение вознаграждения, учитывая ранги индивида на доминирующем фронте Парето.
-
Преимущества отбора на основе вознаграждения
- Позволяет быстро определить наиболее продуктивные направления поиска.
- Максимизирует совокупное вознаграждение отдельных людей.