Lyra (кодек)
-
Особенности и качество Lyra
- Lyra — аудиокодек с потерями от Google для сжатия речи с низкой скоростью передачи данных.
- Алгоритм сжатия основан на машинном обучении, обеспечивая лучшее качество по сравнению с традиционными кодеками.
- Работает с фиксированными скоростями передачи данных 3,2, 6 и 9 Кбит/с, обеспечивая качество при ограниченных сетевых соединениях.
- Обучена на тысячах часов речи на 70 языках для работы с различными языками.
- Простая модель параллельно обрабатывает частотные диапазоны, снижая вычислительную сложность.
- Задержка составляет 20 мс из-за размера кадра.
-
История и развитие
- В декабре 2017 года Google представил препринт статьи о замене декодера Codec 2 на нейронную сеть WaveNet.
- Lyra версии 1 использовала эту структуру для извлечения признаков и нейронного синтеза.
- В феврале 2021 года Lyra была анонсирована, а в апреле Google опубликовал исходный код эталонной реализации.
- Вторая версия (v2/1.2.0) улучшила качество звука, задержку и производительность, а также увеличила скорость передачи данных.
-
Поддержка и приложения
- Реализация Google доступна на GitHub с лицензией Apache, оптимизирована для 64-битных ARM, но работает на x86, Android и Linux.
- Google Duo использует Lyra для передачи звука в видеочатах с ограниченной пропускной способностью.
-
Рекомендации и внешние ссылки
- Ссылки на статью в блоге Google с демонстрацией сравнения кодеков и на другие форматы кодирования звука.