Оглавление
- 1 Функция оценки
- 1.1 Функции оценки в компьютерных играх
- 1.2 Отношение к поиску
- 1.3 Функции оценки в шахматах
- 1.4 Функции оценки, созданные вручную
- 1.5 Нейронные сети в шахматах
- 1.6 Нейронные сети в AlphaZero и Leela Chess Zero
- 1.7 Таблицы “фигура-квадрат”
- 1.8 Эффективно обновляемая нейронная сеть (NNUE)
- 1.9 Базы данных для эндшпиля
- 1.10 Функции оценки в Computer Go
- 1.11 Полный текст статьи:
- 2 Функция оценки
Функция оценки
-
Функции оценки в компьютерных играх
- Функции оценки используются для оценки ценности позиций в игровом дереве.
- Значения могут быть вещественными числами или квантованными целыми числами.
- Функции оценки не являются полностью специальными и определяются эмпирически.
-
Отношение к поиску
- Функции оценки являются частью алгоритмов поиска, таких как поиск по дереву методом Монте-Карло.
- Они не учитывают историю и возможные перемещения узла, что делает их неточными для динамичных позиций.
- Функции оценки зависят от глубины поиска и используемых расширений и сокращений.
-
Функции оценки в шахматах
- В шахматах функции оценки обычно возвращают целые числа, называемые пешками.
- Более масштабные оценки указывают на материальный дисбаланс или позиционное преимущество.
- Функции оценки включают определение материального баланса и позиционных условий.
-
Функции оценки, созданные вручную
- Исторически использовались термины оценочной функции, созданные вручную.
- Функции включают линейную комбинацию различных взвешенных терминов.
- Эффективные функции создаются путем настройки весовых коэффициентов.
-
Нейронные сети в шахматах
- Нейронные сети использовались с конца 1980-х годов, но стали популярными в конце 2010-х.
- Первоначально использовались одна нейронная сеть для всей функции оценки.
- Недавно начали использовать несколько нейронных сетей для разных частей оценки.
- Глубокие нейронные сети стали использоваться после демонстрации в “Giraffe” и “AlphaZero”.
-
Нейронные сети в AlphaZero и Leela Chess Zero
- Используют два выходных сигнала: значение head и политику head
- Значение head выводится в процентах выигрышей, ничьих и поражений
- Для эффективного вычисления функции оценки требуется графический процессор
-
Таблицы “фигура-квадрат”
- Используются с начала 1990-х годов
- Каждая таблица содержит 64 значения для квадратов шахматной доски
- В компьютерных шахматах используются таблицы “король-фигура-квадрат”
- Значения в таблицах отражают бонусы/штрафы за расположение фигур
-
Эффективно обновляемая нейронная сеть (NNUE)
- Разработана Ю Насу в 2018 году
- Использует таблицы “фигура-квадрат” как входные данные
- Включает только один слой и не имеет функций активации
- Впервые использована в Stockfish NNUE в 2020 году
-
Базы данных для эндшпиля
- Используются в шахматных движках для идеальной игры в эндшпиле
-
Функции оценки в Computer Go
- Исторически учитывали контролируемую территорию и влияние камней
- Современные программы используют глубокие нейронные сети и выводят процент выигрыша/ничьей/проигрыша