Обработка речи
-
Основы обработки речи
- Обработка речи включает сбор, манипулирование, хранение, передачу и вывод речевых сигналов.
- Задачи обработки речи включают распознавание, синтез, улучшение и другие.
-
История и развитие
- Ранние попытки обработки речи фокусировались на распознавании простых фонетических элементов.
- В 1952 году была разработана система распознавания цифр.
- В 1966 году был предложен алгоритм LPC для обработки речи.
- В 1990 году был выпущен первый коммерчески доступный продукт для распознавания речи.
- К началу 2000-х годов акцент сместился на использование нейронных сетей и глубокого обучения.
-
Методы обработки
- DTW — алгоритм для измерения сходства между временными последовательностями с разными скоростями.
- Скрытые марковские модели — байесовские сети для оценки скрытой переменной по наблюдениям.
- Искусственные нейронные сети — моделируют нейроны мозга, используются для распознавания речи.
-
Обработка с учетом фаз
- Фазы могут быть использованы для снижения шума и улучшения восстановления речи.
-
Приложения обработки речи
- Включают интерактивный голосовой ответ, виртуальные помощники, идентификацию по голосу, распознавание эмоций и другие.
-
Дополнительные темы
- Упоминаются компьютерная аудиология, нейрокомпьютерная обработка речи, кодирование речи и другие связанные темы.