Редактор Sound Forge 4.5g при установке соответствующей библиотеки позволяет непосредственно редактировать сжатые файлы в формате MP3, но эта возможность на практике используется редко. Чаще выполняется редактирование файлов в исходном формате WAV, а затем производится сжатие (компрессия) с помощью специальных программ – кодеров. Наиболее распространены кодеры, реализующие алгоритмы сжатия с потерями. При сжатии с потерями в результирующем файле теряется часть информации из исходного файла, поэтому, в частности, оказывается невозможным полное восстановление исходного файла. Алгоритмы с потерями позволяют получить более высокую степень сжатия по сравнению с алгоритмами без потерь, которые применяются, например, в программах-архиваторах.
Наиболее распространенным форматом хранения сжатого аудио является MP3 – сокращение от MPEG Layer3. Этот формат разработан Fraunhofer IIS и Thomson и утвержден как часть стандартов сжатого видео и аудио MPEG1 и MPEG2. Данная схема кодирования является наиболее сложной схемой из семейства MPEG Layer 1/2/3. Она требует наибольших затрат машинного времени для кодирования по сравнению с двумя другими и обеспечивает более высокое качество кодирования. Используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.
MP3 – потоковый формат. Это значит, что исходный сигнал при кодировании разбивается на равные по продолжительности участки – фреймы, которые кодируются отдельно. При декодировании конечный сигнал формируется из последовательности декодированных фреймов.
Минимальные субъективные потери качества кодированного в MP3 сигнала достигаются с помощью учета особенностей человеческого слуха. Один из используемых эффектов – это маскирование слабого сигнала одного частотного диапазона более мощным сигналом соседнего диапазона. Другой эффект состоит в том, что мощный сигнал предыдущего фрейма вызывает временное понижение чувствительности уха к сигналу текущего фрейма. Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенных уровней, разных для разных частотных диапазонов. Эта технология называется адаптивным кодированием и позволяет экономить на наименее значимых с точки зрения восприятия человеком деталях звучания.
Степень сжатия сигнала определяется таким параметром, как битрэйт (bitrate). Этот параметр часто называют шириной потока данных. Он определяет, сколько единиц информации требуется для хранения одной секунды звучания сжатой фонограммы. Общепринятая единица измерения битрэйта – килобит на секунду (Кбит/сек или kbs). Заметим, что для несжатых сигналов так же можно ввести понятие битрэйта, при этом его значение легко рассчитывается по известным параметрам оцифровки – частоте дискретизации и разрядности кода (например, для сигнала, оцифрованного с параметрами качества «компакт-диск» – 44100 Гц, 16 бит, стерео – битрэйт определяется так: 44100 х 16 х 2 = 1411 kbs).
Возможно, сегодняшняя «монополия» MP3 скоро будет сломлена начинанием Microsoft – WMA. Но пока рано говорить об этом. В то же время, в связи с появлением Microsoft на данном рынке со столь сильной разработкой можно уверенно предположить, что разработки семейства AAC, прямого наследника MP3, уже не успеют завоевать популярности.
Подробно ознакомиться с технологией и параметрами кодирования в MP3 можно в рекомендованной литературе /6.1/.
В лабораторной работе для получения MP3-файлов мы будем использовать программу AudioActive Production Studio версии 2.04. В ней используется кодер, разработанный совместно с институтом Fraunhofer и являющийся по оценкам экспертов одним из наиболее качественных для битрэйтов выше 128 kbs. Основное окно программы изображено на рис. 6.
Программа может работать в следующих режимах:
кодирование WAV-файлов в форматы MP3, WAV-MP3 и другие (вкладка Encode);
восстановление (декодирование) MP3-файлов в формат WAV (вкладка Decode);
конвертирование MP3-файлов в другие форматы, в том числе в формат MP3 с другими параметрами сжатия (вкладка MP3 Convert);
преобразование (граббинг) в WAV и непосредственно в MP3 аудиотреков с CD-DA (вкладка CD Copy).
Программа AudioActive Production Studio 2.04 позволяет производить как штучную, так и пакетную обработку файлов. Для помещения файла в список обработки нужно нажать кнопку Add File. Параметры кодирования (декодирования, конверсии) устанавливаются в окне Properties (рис. 7), которое активизируется соответствующей кнопкой.
Полезная функция программы – встроенный калькулятор (рис. 8), позволяющий определить параметры выходного файла в зависимости от параметров кодирования и параметров входного файла. Вызов калькулятора производится командой меню Tools>Calculator.
Перед кодированием файла можно произвести предварительную визуальную оценку результата (кнопка Preview). Не забудьте указать путь для размещения результирующего файла (Encoding Properties – вкладка General>Browse). Для начала кодирования просто нажмите кнопку Begin.
Следует помнить, что кодирование с высокими битрэйтами требует больших вычислительных ресурсов. Поэтому для нормального выполнения данной операции желательно использовать компьютер не ниже Pentium 133 с оперативной памятью не менее 32 Мбайт.
Рис. 6. Основное окно AudioActive Production Studio 2.04