Компьютерный звук. Super Light (КВ-Лайт)

Что такое звук? Как он становится "цифровым"? Что такое частота дискретизации и разрядность? Что содержится в современных аудиофайлах и в треках аудиодисков? Что такое битрейт? В чем суть МР3? Лучший ли это стандарт? Какие еще стандарты бывают? Что такое MIDI и как оно связано с мобильными телефонами? Как работают плагины? Что такое эквалайзер? Для чего нужен компрессор?

На эти и на многие другие вопросы мы попытаемся вам ответить в серии статей "Компьютерный звук. SuperLight".

Звуковая волна, аналоговый и цифровой сигналы

Как мы знаем из школьного курса физики, звук - это упругие волны, распространяющиеся в среде. Причем, несколько обобщив, в качестве такой среды мы будем подразумевать только воздух. На самом деле современность требует другого определения. Звук - это информация, передающаяся за счет сигналов, выраженных в изменениях давления воздушной среды. То есть, когда звуковая волна распространяется по воздуху, в нем образуются определенные зоны сжатия и разряжения, что и является сигналом. Наши органы слуха улавливают эти изменения и передают в мозг, который все анализирует. Почему мы взяли именно "информационное" определение звука? Потому что таким образом гораздо легче представить всю модель целиком.

Сигнал может менять свой носитель, и те же изменения давления в воздушной среде можно преобразовать в идентичные изменения характеристик электрического тока, таких, как напряжение и сила тока. Для этих целей нужны простейшие (для наших современнников) устройства - микрофоны и звукосниматели. Звуковой сигнал, переносимый за счет электрического тока, называется аналоговым, то есть "аналогичным" сигналу, переносимому воздушной средой. При этом с помощью акустических систем электрический аналоговый сигнал может быть обратно преобразован в изменения воздушной среды.

Благодаря этому открытию ученые сделали сильный прорыв, а именно - получили возможность фиксировать информацию на определенные физические носители, будь то магнитная лента или прорезанная дорожка на виниловой пластинке, которые также получили название "аналоговых". Во-вторых, с помощью специальных электрических схем и элементов появилась возможность усиливать сигнал. Благодаря этому мы имеем такой инструмент, как электрогитара, который в древние времена просто не имел бы права на существование.

Но фиксацию аналогового сигнала на аналоговые же носители нельзя назвать хорошим изобретением. Во-первых, сами носители не долговечны, во-вторых, копирование с одного на другой всегда связано с потерей качества. Ситуацию спас цифровой подход к звуку.

Цифровой сигнал - этот тот же аналоговый, только изменения характеристики напряжения в нем переводятся в определенные цифровые значения, взятые через равные короткие интервалы времени. Для этих целей используются специальные устройства, именуемые аналого-цифровыми преобразователями или, сокращенно, АЦП (в англоязычной терминологии ADC). Самая большая проблема в том, что в каждый отсчет времени звук берется дискретно (прерывно), то есть из непрерывного аналогового сигнала выбирается только одна точка. Поэтому для достоверного цифрового описания звуковой волны этих точек должно быть взято очень много за предельно короткие промежутки времени. Частота такой выборки называется "частотой дискретизации", и, согласно теореме Котельникова (а за рубежом это называется критериями Найквиста), она должна быть в два раза больше самого высокого звука, воспринимаемого человеческим ухом (16-20 КГц). Открывая разные учебники физики, вы можете найти различные значения верхнего порога слышимости. Поэтому, например, на компьютерах Apple была принята за стандарт частота дискретизации 32 КГц, а в РС-совместимых использовалась частота, обозначенная Красной Книгой (документ, регламентирующий характеристики аудио компакт-диска), - 44,1 КГц. А что это означает физически? В каждую секунду АЦП "выбирает" из аналогового сигнала 44100 цифровых значений. Как вы понимаете, для этих целей нужны очень мощные аналого-цифровые преобразователи, и на данный момент в превалирующем большинстве случаев используются так называемые "сигма-дельта" АЦП, достаточно сложные по конструкции.

Помимо частоты дискретизации, у цифрового звука есть еще один важный параметр - разрядность преобразования, что имеет самое прямое отношение к тем цифровым значениям, которые выбираются. Дело в том, что выборка дискретна не только по времени, но и по значениям напряжения. Представьте, что у нас есть некий динамический диапазон - разница между самым громким и самым тихим звуками (или просто тишиной). Вот этот интервал разбивается на некоторое количество определенных дискретных значений напряжений. Это количество зависит от разрядности преобразователя, обозначаемой в битах, например, если говорится о 8-битном (или 8-разрядном) преобразователе, то это значит, что в динамическом диапазоне умещается 2 в восьмой степени определенно заданных значений уровней напряжения, то есть, 256. При "оцифровке" аналогового звука АЦП считывает текущее значение напряжения и присваивает ему ближайшее дискретное. Как вы понимаете, чем больше разрядность, тем выше точность. Например, 16-битные АЦП оперируют 65536 значениями, 24-битные - 16777216. Причем в обоих случаях мы говорим об одном и том же громкостном (динамическом) диапазоне, только на каждое одно значение напряжения в 16-разрядном преобразователе приходится 256 значений в 24-разрядном. Точность, естественно, выше.

Данный метод оцифровки называется Импульсно-Кодовой Модуляцией (ИКМ) или Pulse Code Modulation (PCM) в зарубежной терминологии.

Наиболее распространенные форматы аудио-файлов

Wav - "wav" является расширением файлов, записанных в формате Wave, который подразумевает практически чистую ИКМ. То есть он хранит в себе данные, полученные при стандартной оцифровке. Ограничения существуют только по количеству каналов (моно, стерео), частота дискретизации и разрядность могут быть любыми. Ранее на старых компьютерах вы могли вместо wav-файлов встретить расширение *.pcm, что, по сути, одно и то же.

CDDA - стандарт аудио компакт-диска, предусмотренный Красной Книгой. По существу, это обычные wav-файлы с характеристиками 16 бит, 44,1 КГц, стерео, но записанные с учетом специфики носителя информации и в ряде случаев предусмотренной защитой от незаконного копирования. Данные разбиваются и записываются на сектора, и скорость чтения считается в количестве секторов в секунду (в стандартном варианте 75 секторов/с, каждый сектор вмещает 2352 байта).

Битрейт (bitrate) - данная величина описывает количество информации, передаваемой в секунду. Для компакт-дисков и wav-файлов она высчитывается по стандартной формуле и сразу же переводится в килобиты/с (делится на 1000):

Bitrate (килобит в секунду) = Частота дискретизации (Гц или кол-во сэмплов в секунду) х Разрядность (в битах) х Количество каналов/1000.

Таким образом, например, для дорожек в CDDA и wav-файлов с характеристиками 16 БИТ/44,1 КГц/стерео битрейт составляет 1411,2 Кбит/с, что при переводе означает чуть более 10 Мб в минуту. Такая величина, как битрейт, взята за основу в форматах сжатых аудио-файлов. Как происходит это сжатие, мы рассмотрим в следующей части статьи.

Кристофер,
[email protected]