Что ж, мы готовы к погружению в океан цифрового звука. Так погрузимся же!

Введение в цифровой звук

Начнем, как всегда, с теории. А именно: выясним, как звуковые данные кодируются и сохраняются в файлах и какие форматы записи звука чаще всего используются.

Три способа кодирования звука

Звук может быть закодирован в цифровой формат с использованием трех принципиально различных методов. (Они различаются так же, как покадровая и трансформационная анимация.) Давайте все о них разузнаем.

Прямая оцифровка

Первый метод, применяемый при кодировании звука, - самый простой и очевидный. Источник звука подключается к линейному входу звуковой карты компьютера, после чего звук переписывается на компьютер и сохраняется в файле. Этот метод называется прямой оцифровкой звука.

Для кодирования звука методом прямой оцифровки используется способ, называемый PCM (Pulse Coded Modulation - импульсно-кодовая модуляция). Суть его в том, что звуковая карта с частотой много тысяч раз в секунду замеряет уровень звукового сигнала и записывает получившиеся значения в массив данных. Этот массив данных и представляет собой оцифрованный звук.

Преимущество у способа РСМ одно - звук копируется очень точно, со всеми нюансами. Именно поэтому прямая оцифровка - самый популярный путь к тому, чтобы дать звуку новую, цифровую, жизнь. Все цифровые звуковые данные - компакт-диски, файлы MP3 - записаны именно таким образом.

Недостаток у прямой оцифровки, пожалуй, тоже один - очень большой объем результирующего массива данных. (В самом деле, сколько значений получится, если замерять уровень сигнала, скажем, 44 100 раз в секунду!) Поэтому, чтобы уменьшить его, практически всегда применяется сжатие звука - как правило, с потерями. Для этого используются специальные алгоритмы (и кодеки), "заточенные" под звук.

Алгоритмов сжатия звука в мире существует, по крайней мере, не меньше, чем кодеков, предназначенных для сжатия видео. Давайте рассмотрим самые распространенные из них.

□ ADPCM. Был разработан фирмой Microsoft для сжатия звуковых файлов WAV еще в начале 90-х годов прошлого века. Обеспечивает не очень сильное сжатие, зато без потерь. Сейчас применяется только для сжатия очень коротких звуковых клипов, в основном - системных "сигналов" операционной системы Windows.

□    MPEG I level 3 (MP3). Был разработан университетом Фраунгофера в Германии в середине 90-х годов для сжатия звуковых файлов. Является версией известного алгоритма сжатия видео MPEG I (см. главу /), специально предназначенной для сжатия звука. В настоящее время - самый популярный формат сжатия звука.

□    RealMedia. Был разработан фирмой RealNetwork в середине 90-х годов для распространения видео и музыки через Интернет. Собственно, мы уже рассматривали его в главе 1. В настоящее время - один из популярнейших алгоритмов сжатия звука.

□    OGG Vorbis. Был разработан сообществом независимых программистов в конце 90-х годов как замена MPEG I level 3. В настоящее время потихоньку завоевывает популярность. Программное обеспечение для сжатия звука поставляется бесплатно с открытыми исходными текстами.


⇐ вернуться назад | | далее ⇒