Функция взмаха

Оглавление1 Функция взмаха1.1 Определение функции swish1.2 История и открытия1.3 Свойства функции swish1.4 Применение функции swish1.5 Рекомендации2 Функция взмаха — Википедия […]

Функция взмаха

  • Определение функции swish

    • Функция swish – это математическая функция с обучаемым параметром β или постоянным β = 1. 
    • При β = 1 функция swish эквивалентна сигмовидной линейной единице или SiLU. 
  • История и открытия

    • SiLU была повторно открыта как функция линейных единиц, взвешенных по сигмовидной форме, в обучении с подкреплением. 
    • Swish был предложен без обучаемого параметра β, но позже обновлен с обучаемым параметром. 
  • Свойства функции swish

    • При β = 0 функция swish становится масштабируемой линейной функцией. 
    • При β → ∞ функция swish приближается к функции ReLU. 
    • Swish можно рассматривать как функцию сглаживания между линейной функцией и функцией ReLU. 
  • Применение функции swish

    • В 2017 году Google обнаружил, что использование swish в искусственных нейронных сетях улучшает производительность по сравнению с ReLU и сигмоидом. 
    • Считается, что swish помогает устранить проблему исчезающего градиента при обратном распространении. 
  • Рекомендации

    • Обычно исследователи принимают β = 1, но можно использовать и обучаемый параметр β. 

Полный текст статьи:

Функция взмаха — Википедия

Оставьте комментарий