Распознавание речи

  • Распознавание речи (ASR) — сложная задача, требующая обработки акустических сигналов и понимания языка. 
  • ASR включает в себя фонетику, акустику и языковую модель. 
  • HMM (скрытые марковские модели) являются популярным подходом к ASR, использующим статистические методы. 
  • Декодирование речи использует алгоритм Витерби для поиска наилучшего пути. 
  • Динамическое искажение времени (DTW) — исторический подход к распознаванию речи, вытесненный более успешными методами на основе HMM. 
  • Нейронные сети являются привлекательным подходом к акустическому моделированию в ASR. 
  • Глубокие нейронные сети и автоэнкодеры с шумоподавлением исследуются для улучшения производительности в распознавании речи. 
  • Комплексное автоматическое распознавание речи включает в себя совместные изучение всех компонентов распознавателя речи. 
  • Пересказана только часть статьи. Для продолжения перейдите к чтению оригинала. 

Полный текст статьи:

Распознавание речи — Википедия, свободная энциклопедия

Оставьте комментарий

Прокрутить вверх