Функция оценки

Оглавление1 Функция оценки1.1 Функции оценки в компьютерных играх1.2 Отношение к поиску1.3 Функции оценки в шахматах1.4 Функции оценки, созданные вручную1.5 Нейронные […]

Функция оценки

  • Функции оценки в компьютерных играх

    • Функции оценки используются для оценки ценности позиций в игровом дереве.  
    • Значения могут быть вещественными числами или квантованными целыми числами.  
    • Функции оценки не являются полностью специальными и определяются эмпирически.  
  • Отношение к поиску

    • Функции оценки являются частью алгоритмов поиска, таких как поиск по дереву методом Монте-Карло.  
    • Они не учитывают историю и возможные перемещения узла, что делает их неточными для динамичных позиций.  
    • Функции оценки зависят от глубины поиска и используемых расширений и сокращений.  
  • Функции оценки в шахматах

    • В шахматах функции оценки обычно возвращают целые числа, называемые пешками.  
    • Более масштабные оценки указывают на материальный дисбаланс или позиционное преимущество.  
    • Функции оценки включают определение материального баланса и позиционных условий.  
  • Функции оценки, созданные вручную

    • Исторически использовались термины оценочной функции, созданные вручную.  
    • Функции включают линейную комбинацию различных взвешенных терминов.  
    • Эффективные функции создаются путем настройки весовых коэффициентов.  
  • Нейронные сети в шахматах

    • Нейронные сети использовались с конца 1980-х годов, но стали популярными в конце 2010-х.  
    • Первоначально использовались одна нейронная сеть для всей функции оценки.  
    • Недавно начали использовать несколько нейронных сетей для разных частей оценки.  
    • Глубокие нейронные сети стали использоваться после демонстрации в “Giraffe” и “AlphaZero”.  
  • Нейронные сети в AlphaZero и Leela Chess Zero

    • Используют два выходных сигнала: значение head и политику head  
    • Значение head выводится в процентах выигрышей, ничьих и поражений  
    • Для эффективного вычисления функции оценки требуется графический процессор  
  • Таблицы “фигура-квадрат”

    • Используются с начала 1990-х годов  
    • Каждая таблица содержит 64 значения для квадратов шахматной доски  
    • В компьютерных шахматах используются таблицы “король-фигура-квадрат”  
    • Значения в таблицах отражают бонусы/штрафы за расположение фигур  
  • Эффективно обновляемая нейронная сеть (NNUE)

    • Разработана Ю Насу в 2018 году  
    • Использует таблицы “фигура-квадрат” как входные данные  
    • Включает только один слой и не имеет функций активации  
    • Впервые использована в Stockfish NNUE в 2020 году  
  • Базы данных для эндшпиля

    • Используются в шахматных движках для идеальной игры в эндшпиле  
  • Функции оценки в Computer Go

    • Исторически учитывали контролируемую территорию и влияние камней  
    • Современные программы используют глубокие нейронные сети и выводят процент выигрыша/ничьей/проигрыша  

Полный текст статьи:

Функция оценки

Оставьте комментарий

Прокрутить вверх