Обратное распространение
- Статья представляет собой краткое описание алгоритма обратного распространения для обучения многослойных нейронных сетей.
- Обратный распространение используется для вычисления градиента функции потерь по отношению к весам сети.
- Цель обучения состоит в нахождении функции, которая наилучшим образом сопоставляет набор входных данных с их правильными выходными данными.
- Обучение может быть сведено к задаче оптимизации, заключающейся в нахождении функции, которая будет выдавать минимальную ошибку.
- Функция потерь зависит от входящих весов для нейрона, которые должны быть изменены в сети для обеспечения обучения.
- Алгоритм градиентного спуска используется для поиска набора весов, который минимизирует ошибку.
- Обратный распространение вычисляет производную функции потерь по отношению к весам сети, используя правило цепочки дважды.
- Пересказана только часть статьи. Для продолжения перейдите к чтению оригинала.
Полный текст статьи: