Распознавание и синтез речи — Википедия

Распознавание и синтез речи Описание приложения Google Speech Services Приложение для чтения с экрана на Android, преобразующее текст в речь […]

Распознавание и синтез речи

  • Описание приложения Google Speech Services

    • Приложение для чтения с экрана на Android, преобразующее текст в речь на множестве языков. 
    • Используется в приложениях Google, таких как Google Play Books, Google Translate, и сторонних приложениях с поддержкой специальных возможностей. 
    • Требует установки голосовых данных для каждого языка. 
  • Поддержка языков

    • Включает более 100 языков, включая распространенные и редкие диалекты. 
  • История и развитие

    • Приложения, такие как Hyundai, адаптировали функцию преобразования текста в речь для Android Auto в 2015 году. 
    • Google Cloud использует технологию WaveNet для синтеза речи с акцентом и интонацией. 
    • WaveNet отличается от конкурентов, таких как Amazon и Microsoft, созданием необработанных звуковых сигналов с нуля. 
  • Технические детали

    • WaveNet использует нейронную сеть для обучения на больших объемах речевых данных. 
    • Способна генерировать речь с нуля, обрабатывая до 24 000 выборок в секунду. 
  • Переименование и дополнительные ресурсы

    • В 2023 году сервис переименован в Speech Recognition & Synthesis. 
    • Ссылки на другие статьи о синтезе речи и рекомендации по использованию сервиса предоставлены. 

Полный текст статьи:

Распознавание и синтез речи — Википедия

Оставьте комментарий

Прокрутить вверх