Популярные форматы аудио. Аудио форматы

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог - хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На графиках - хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но… На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование - всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее - если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и ), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) - MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.

Зачастую является мерилом качества трека. Много споров ведется о том, какой же самый лучший формат музыки. Вот и я на днях стал свидетелем подобного спора. Не виртуального, а реального.В общем, решил я написать статью про аудиоформаты и человеческим языком попытаться объяснить какой самый лучший формат аудио. Постараюсь избежать заумных терминов и описания характеристик, чтобы лишний раз не травмировать мозг читающих.

Сразу же признаюсь, что не буду петь дифирамбы в честь какого-то конкретного аудиоформата, равно как и “опускать” никого не собираюсь. Пускай каждый сам решает. Не буду залезать в “дебри” и пробегусь по наиболее известным форматам музыки высокого качества.

Я считаю, что споры эти ведут люди, мягко говоря, не сведущие в этой теме. Так как профессионалы (то есть люди, которые знают, что они делают и зачем они это делают) не будут заниматься подобным. При нынешнем изобилии аудио форматов любой нуждающийся найдет то, что ему нужно. Согласитесь, глупо будет выглядеть спор тракториста и шофера, на тему что лучше – трактор или машина. Для одних целей – трактор, для других – машина. Вот и здесь так же.

WAV – справедливо считается самым качественным форматом музыки. Этот формат аудио без сжатия и без потери качества. Используется при записи и обработке звука, это самый качественный звук, так как запись в WAV происходит без сжатия. Кодируется в любой другой аудиоформат. Ну и как результат – довольно много “весит”, поэтому используется преимущественно при звукозаписи.

Сжатие звука с потерями

Начну со всем известного и всеми применяемого (хоть и не всегда любимого) формата MP3. Этот аудиоформат активно используется везде и всюду, где надо и где не надо. Но это не значит, что он недостоин места, которое занимает в своей нише. Очень даже достоин. Хоть “сидит” он в своей нише уже около двух десятков лет, никто его пока оттуда не “вышиб”. А желающих было много надо сказать. И главный фаворит из них WMA (Windows Media ), который задуман был Microsoft, как альтернативаMP3. В итоге он альтернативой и является, не смотря на старания разработчиков. Следующий персонаж – OGG . Несмотря на более широкие возможности, чем MP3 , например, так и не получил массового признания. Хоть и поддерживается многими операционными системами. Пожалуй, стоит упомянуть еще аудиоформат AAC, который должен был в эстафете сменить . В нем улучшено качество кодирования и уменьшены потери при сжатии. Но… увы.

Главным преимуществом этих форматов является небольшой размер. Из минусов – потеря качества.

Сжатие звука без потерь

FLAC – пожалуй, самый популярный кодек кодирования и формат звука без потери качества. Меломаны постепенно переходят на этот формат. WavPack составляет ему достойную конкуренцию, но не так популярен. Такая же история и с Apple Lossless , в котором размер сжимается до 60%.

Здесь история с точностью до наоборот: качество лучше, а размер больше.

Скептики утверждают, что на слух практически невозможно отличить MP3 (320 кбит/c) от Losless . “А если разницы нет, зачем платить больше?”. Действительно, на обычной аппаратуре почувствовать разницу аудиоформатов достаточно сложно, даже меломанам. Но есть и такие, которые эту разницу сразу чувствуют (лично присутствовал на эксперименте). А вот при прослушивании на хорошем аппарате разница огромная. Вся беда в том, что хороший аппарат далеко не все себе могут позволить.

Практически любой пользователь компьютера периодически слушает на нем музыку, которая хранится в электронном виде. Форматов для хранения музыки существует достаточно много, каждый из них был разработан для конкретных задач:

  • Воспроизведение с CD диска;
  • Звуковое сопровождение компьютерной игры;
  • Аудиодорожка в ;
  • Потоковое воспроизведение через Интернет;
  • Рингтоны для мобильных телефонов.

Попробуем разобраться в некоторых из них, также как и в …
Основные определения

  • Битрейт – объем информации, используемый при кодировании для воспроизведения 1 секунды. Чем он выше – тем меньше искажений, и звук максимально соответствует оригиналу.
  • Lossless – кодирование звука без потерь качества. При конвертировании в lossless-форматы и обратно получаем абсолютно одинаковый звук.
  • Lossy – форматы сжатия, рассчитанные на то, что человек просто физически не может слышать определенные частоты, которые пропускаются в процессе конвертации. При этом можно значительно сэкономить на объеме дискового пространства.

Audio-CD

Формат, положивший начало эпохе цифрового звука после перехода с виниловых пластинок. Был принят за стандарт в 1979 году компаниями Philips и Sony. В формате audio-CD физически музыка может храниться только на оптическом носителе, при записи на жесткий диск звуковая дорожка должна быть переконвертирована.

Благодаря высочайшему качеству звука и возможности воспроизведения на любом проигрывателе формат остается очень популярным, несмотря на то, что он достаточно устарел.

Flac

Пожалуй, самый распространенный формат для хранения музыки в losseless. По сравнению с остальными кодеками, обеспечивающими сжатие аудио без потерь, flac, разработанный компанией xiph.org , абсолютно бесплатен и дает минимальный размер выходного файла.

Mp3

Самый массовый музыкальный формат, принятый в качестве неофициального стандарта для любого устройства воспроизведения. Его популярность основана на том, что благодаря срезанию неслышимых ухом частот при практически том же качестве звука mp3 файл составляет 30% от оригинального losseless-файла.

Первая звуковая дорожка в mp3-формате появилась еще в 1994 году. Одна из причин популярности – возможность хранения разнообразной дополнительной информации в тегах аудиофайлов и удобство организации музыкальной библиотеки.

Ogg

Новый lossy-формат, увидевший свет в 2002 году как бесплатная альтернатива платным форматам. В отличие от своих предшественником, в частности mp3, допускает возможность многоканального кодирования и хранения многоканального аудио. Получил наибольшее распространение в видеоиграх.

Звук — это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.

Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Для того чтобы Вам было совсем понятно, скажу, что запись файла на жесткий диск подобна тому, как Вы набиваете таблицы в Microsoft Excel. Естественно данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко(я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали — это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga — одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря прошитый в синтезатор сэмпл.

AIF или AIFF

Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

AIFС или AIFF-С

Тот же AIFF, только с заданными параметрами сжатия(компрессии ).

Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало«весят », за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-Law 8 кГц — моно. Но есть и 16-ти битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициэнт сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для«обычных немузыкальных» людей потери не ощутимы явно.

Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF — процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук(не музыкальных).

НСОМ

То же самое, что и VOC(восемь бит, моно), но только для Apple Macintosh.

Стандартный формат U-Law. 8 кГц, 8 бит, моно.

Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость пердачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Бывает двух видов. Один — это тот же AU для SUN и NeXT. Другой — это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.

IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff ) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: