Выбор на основе вознаграждения

Выбор, основанный на вознаграждении Основы отбора на основе вознаграждения Отбор на основе вознаграждения используется в эволюционных алгоритмах для выбора решений […]

Выбор, основанный на вознаграждении

  • Основы отбора на основе вознаграждения

    • Отбор на основе вознаграждения используется в эволюционных алгоритмах для выбора решений для рекомбинации. 
    • Вероятность выбора человека пропорциональна его совокупному вознаграждению. 
    • Вознаграждение включает индивидуальное вознаграждение и вознаграждение, унаследованное от родителей. 
  • Применение отбора на основе вознаграждения

    • Используется в Multi-armed bandit для оптимизации нескольких целей. 
    • Новорожденный и его родители получают вознаграждение в зависимости от его выбора для новой популяции. 
  • Определение вознаграждения

    • Вознаграждение может быть равно единице, если индивид выбран для новой популяции. 
    • Может быть основано на рангах индивида в популяции или на его вкладе в улучшение качества популяции. 
    • Возможно смягчение вознаграждения, учитывая ранги индивида на доминирующем фронте Парето. 
  • Преимущества отбора на основе вознаграждения

    • Позволяет быстро определить наиболее продуктивные направления поиска. 
    • Максимизирует совокупное вознаграждение отдельных людей. 

Полный текст статьи:

Выбор на основе вознаграждения — Википедия

Оставьте комментарий

Прокрутить вверх