MP3-файл
-
История и разработка MP3
- MP3 разработан Обществом Фраунгофера под руководством Карлхайнца Бранденбурга.
- Разработан для значительного сокращения объема данных при сохранении качества звука.
- Первоначально определен в 1991 году как часть стандарта MPEG-1, затем расширен до стандарта MPEG-2.
-
Принцип работы MP3
- Использует сжатие с потерями для уменьшения размера файлов.
- Основан на слуховой маскировке, описанной Альфредом Майером и другими.
- Включает дискретное косинусное преобразование (DCT) и модифицированное DCT (MDCT).
-
Предшественники и развитие
- Предшественники: OCF, PXFM, ASPEC, MUSICAM, ATAC, SB-ADPCM.
- ASPEC победил в конкурсе качества, но был отклонен как сложный для реализации.
- MUSICAM был разработан для цифрового радио и телевидения, продемонстрирован в 1991 году.
-
Влияние и популярность
- MP3 стал популярным в конце 1990-х благодаря буму распространения музыки через Интернет.
- Ассоциируется со спорами о нарушении авторских прав и пиратстве.
- Поддержка MP3 остается практически универсальной благодаря портативным медиаплеерам.
-
Разработка MP3
- Карлхайнц Бранденбург работал над сжатием музыки в Институте Генриха Герца Общества Фраунгофера.
- В 1993 году он присоединился к коллективу Fraunhofer HHI.
- Песня Сюзанны Веги «Tom’s Diner» стала первой песней, использованной для разработки формата MP3.
-
Стандартизация MPEG audio
- В 1991 году были рассмотрены предложения MUSICAM и ASPEC.
- MUSICAM был выбран из-за простоты и устойчивости к ошибкам.
- Формат MUSICAM стал основой для MPEG Audio Layer I и Layer II.
- Layer III (MP3) был разработан на основе Layer II и интегрировал идеи ASPEC.
-
Эффективность сжатия
- Эффективность сжатия кодеров определяется скоростью передачи данных.
- Данные о степени сжатия часто публикуются с использованием параметров CD или DAT.
- Коэффициенты сжатия при DAT выше, что демонстрирует проблему с использованием термина «коэффициент сжатия».
-
Выход на публику
- В 1994 году была разработана эталонная реализация программного обеспечения для моделирования MPEG.
- В 1995 году Общество Фраунгофера выпустило первый программный MP3-кодировщик.
- С появлением первого программного MP3-плеера WinPlay3 многие люди смогли кодировать и воспроизводить MP3-файлы.
-
Дополнительные версии
- В 1994 году был завершен второй набор стандартов MPEG, MPEG-2.
- MPEG-2 Part 3 определил 42 дополнительные скорости передачи данных и частоты дискретизации.
- MPEG-2.5 audio расширил возможности MP3, добавив дополнительные частоты дискретизации.
-
Стандарты и поддержка
- ISO/IEC 11172-3 определил три формата: MPEG-1 Audio Layer I, Layer II и Layer III.
- ISO/IEC 13818-3 определил расширенную версию MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II и Layer III.
- MPEG-2 Audio не следует путать с MPEG-2 AAC.
- LAME — самый продвинутый MP3-кодировщик, включающий кодирование с переменной скоростью передачи данных.
-
История и распространение MP3
- MP3-файлы начали распространяться в Интернете в 1990-х годах.
- Первый известный эксперимент был организован IUMA в начале 1990-х.
- Популярность MP3-файлов выросла с появлением Winamp в 1997 году.
- В 1998 году был выпущен первый портативный аудиоплеер MPMan.
- В 1999 году была запущена сеть Napster, что привело к нарушениям авторских прав.
-
Дизайн и структура MP3
- MP3-файл состоит из кадров, содержащих заголовок и блок данных.
- Кадры не являются независимыми элементами и не могут быть извлечены на произвольных границах.
- Блоки данных содержат сжатую аудиоинформацию.
- Большинство современных MP3-файлов содержат метаданные ID3.
-
Кодирование и декодирование MP3
- Сжатие MP3 работает за счет снижения точности определенных компонентов звука.
- Алгоритм кодирования включает деление на кадры, преобразование в FFT, психоакустическое моделирование и форматирование битового потока.
- MPEG-1 не содержит точных спецификаций для MP3-кодера, но содержит примеры моделей.
- LAME стал де-факто MP3-кодером CBR, позже был добавлен режим ABR.
-
Качество MP3
- Качество зависит от скорости передачи данных и алгоритма кодирования.
- Разные кодировщики могут иметь разное качество при одинаковой скорости передачи данных.
- Качество зависит от выбора кодера и параметров кодирования.
- На ранних этапах скорость передачи данных была главным фактором, позже стали использовать переменную скорость передачи данных.
-
Концепция сжатия аудиофайлов
- Некоторые разделы аудиофайлов легче сжимать, чем другие.
- Общее качество файла можно улучшить, используя разную скорость передачи данных для разных фрагментов.
- Некоторые MP3-кодеры позволяют задавать заданное качество.
-
Влияние условий прослушивания
- Условия прослушивания, внимание слушателя и аудиооборудование влияют на воспринимаемое качество.
- Для лекций и приложений с человеческой речью можно использовать более низкие настройки качества.
-
Исследование качества MP3
- Профессор музыки Джонатан Бергер отметил рост предпочтений студентов к MP3.
- Райан Магуайр создал трек «moDernisT» из звуков, удаленных при сжатии MP3.
-
Скорость передачи данных
- Скорость передачи данных зависит от частоты дискретизации и количества битов на сэмпл.
- MP3 поддерживает скорости до 320 кбит/с, MPEG-2 — до 160 кбит/с.
- MPEG-2 удаляет частоты, превышающие половину новой частоты дискретизации.
-
MPEG-1 и MPEG-2
- MPEG-1 поддерживает 14 скоростей передачи данных и 3 частоты дискретизации.
- MPEG-2 поддерживает 14 скоростей передачи данных и 3 частоты дискретизации, в два раза меньше.
- MPEG-2.5 поддерживает 8 скоростей передачи данных и 3 частоты дискретизации.
-
Воспроизведение и кодирование
- Файлы MP3 со скоростью ниже 32 кбит/с могут воспроизводиться в ускоренном режиме.
- MPEG-2 позволяет воспроизводить звук до 12 кГц со скоростью до 160 кбит/с.
- Для воспроизведения речи достаточно полосы пропускания 5 512 Гц.
-
Параметры качества и скорости передачи данных
- Параметр качества n.nnn (-V) поддерживает переменную скорость передачи данных.
- Частота дискретизации 44,1 кГц обычно используется для музыки.
- В Интернете используются скорости передачи данных до 320 кбит/с.
-
Типы кодирования
- CBR (постоянная скорость передачи данных) и VBR (переменная скорость передачи данных) используются для кодирования.
- VBR обеспечивает фиксированный уровень качества, но менее предсказуем по размеру файла.
- LAME поддерживает генерацию MP3-форматов VBR, ABR и CBR.
-
Вспомогательные данные и метаданные
- Вспомогательные данные используются для хранения пользовательских данных.
- Метаданные, такие как название и исполнитель, хранятся в тегах.
- Наиболее распространенные форматы тегов: ID3v1, ID3v2 и APEv2.
-
DRM и ReplayGain
- Теги могут использоваться для DRM и ReplayGain для нормализации громкости.
- MP3Gain позволяет изменять файлы для корректного воспроизведения на разных проигрывателях.
-
Лицензирование и патенты на MP3
- В ЕС патенты на MP3 истекли в 2012 году.
- В США патенты истекли в период с 2007 по 2017 год.
- В прошлом многие организации заявляли о правах на патенты, что приводило к юридическим угрозам.
-
История и стандарты
- Первоначальный стандарт MPEG-1 был опубликован в 1991 году.
- Патенты на MP3, поданные после 1992 года, сомнительны.
- В США срок действия патентов истек в 2015-2017 годах.
-
Лицензирование и патенты в США
- Technicolor контролировала лицензирование MP3 в США и других странах.
- В 2005 году Technicolor лицензировала патенты на MP3.
- В 2017 году Technicolor прекратила лицензирование.
-
Альтернативные технологии
- Существуют другие форматы с потерями, такие как AAC и mp3PRO.
- AAC использует чисто MDCT, что повышает эффективность сжатия.
- Существуют открытые форматы сжатия, такие как Opus и Vorbis.
-
История и патенты в Европе
- В Европе патенты на MP3 также истекли в 2012 году.