Оглавление
Распознавание и синтез речи
-
Описание приложения Google Speech Services
- Приложение для чтения с экрана на Android, преобразующее текст в речь на множестве языков.
- Используется в приложениях Google, таких как Google Play Books, Google Translate, и сторонних приложениях с поддержкой специальных возможностей.
- Требует установки голосовых данных для каждого языка.
-
Поддержка языков
- Включает более 100 языков, включая распространенные и редкие диалекты.
-
История и развитие
- Приложения, такие как Hyundai, адаптировали функцию преобразования текста в речь для Android Auto в 2015 году.
- Google Cloud использует технологию WaveNet для синтеза речи с акцентом и интонацией.
- WaveNet отличается от конкурентов, таких как Amazon и Microsoft, созданием необработанных звуковых сигналов с нуля.
-
Технические детали
- WaveNet использует нейронную сеть для обучения на больших объемах речевых данных.
- Способна генерировать речь с нуля, обрабатывая до 24 000 выборок в секунду.
-
Переименование и дополнительные ресурсы
- В 2023 году сервис переименован в Speech Recognition & Synthesis.
- Ссылки на другие статьи о синтезе речи и рекомендации по использованию сервиса предоставлены.
Полный текст статьи: