0

Сравнение

VIP Club

Формат aacPlus

Автор статьи: Сергеев Михаил
15.01.2005 1954 0
Несмотря на широкое распространение различных форматов сжатия звуковой информации разработчики непрерывно занимаются их совершенствованием
Как известно, в качестве формата записи звука для видео в MPEG-4 DVD-форум первоначально утвердил как основной AAC - Advanced Audio Coding, усовершенствованную версию АС-3, более известную как Dolby Digital, которая применяется для многоканальной записи звука на DVD. Формат ААС уже широко, хотя и не так как MP3, используется для сжатия музыкальных программ. Однако он не пригоден для существующих систем с низкой скоростью потока данных, таких как цифровое радиовещание, интернет-вещание (web radio) и мобильные мультимедийные приложения, поскольку имеет достаточно большой поток, которые указанные системы не и состоянии пропустить.
Рис 1. Пример частотного ограничения типичного сигнала
Налагаемые ограничения являются системными. Так, в цифровом радиовещании (наземном или спутниковом) ограничивающим фактором выступает общая ширина полосы частот, выделенных для канала. Чтобы обеспечить слушателя достаточным набором привлекательных программ, для каждой из них приходится использовать канал с низким битрейтом. Сходная ситуация и в области мобильной связи. Для интернет-приложений теоретически можно было бы использовать записи с большими битрейтами, но количество абонентов с высокоскоростным доступом ограничено. Поэтому разработчики систем вынуждены использовать высокоэффективные (с точки зрения уменьшения скорости потока) аудиокодеки с малым потоком данных, в основе которых лежит перцептуальная модель слуха человека (такие как MP3 или ААС). Однако использование перцентуального кодирования с низким битрейтом не исключает потерь. Современные методы кодирования предполагают, что «CD-качество» достигается при битрейте 128 кбит/с и выше. Это приблизительно соответствует сжатию 12:1. При скорости ниже указанной использование большинства кодеков приводит к существенной деградации музыкальной программы. Чтобы справиться с поставленной задачей, кодеки или ограничивают полосу или уменьшают стереообраз, то есть частично объединяют информацию двух каналов и делают из них joint stereo. При потоке 64 кбит/с, например, MP3 или ограничивает полосу частотой 10 кГц, или привносит множество артефактов кодирования.
Сетевое решение
Распространение предоставления аудиовидеоинформации по сетям сдерживается тем, что для большей части территорий пиковая полоса пропускания этих сетей составляет не более 144 кбит/с, притом что каждый индивидуальный пользователь имеет подключение 40 кбит/с (обычно даже меньше - 28 кбит/с). Объединение экономичного High-efficiency ААС с видео в MPEG-4 позволяет снизить степень сжатия изображения, обеспечивая ему тем более высокое качество без потерь в звуке, и использовать их для передачи при малых скоростях потока.
Компания Coding Technologies разработала систему улучшения существующих кодеков, позволяющую значительно снизить скорость потока данных. Этот комплексный метод называется SRC (Spectral Hand Replication, то есть восстановление спектральной полосы) и позволяет при перцептуальном кодировании с низким битрейтом увеличить полосу сигнала до принятых к аналоговом FM-вещании 15 кГц или даже выше.
Рис. 2. Результаты слуховых испытаний EBU для стереозвука 48 кбит/с
С технической точки зрения, в SRC используется метод, подобный реализованному при записи HDCD. Входной звуковой сигнал обрабатывается SRC-кодеком, который, с одной стороны, выделяет низкочастотную составляющую, а с другой - анализирует связь (корреляцию) между его низко- и высокочастотными составляющими, используя для ее описания очень малый объем данных. Затем низкочастотная составляющая кодируется обычным кодеком, и к этим сжатым низкочастотным данным добавляются полученные ранее SRC-данные, описывающие высокочастотную составляющую. Сходство с HDCD заключается в том, что SRC-данные размещаются в дополнительных полях данных НЧ-сигнала. Это позволяет использовать как традиционные декодеры (в этом случае будет восстановлена только низкочастотная составляющая), так и декодеры с SRC, на выходе которых получается практически исходный сигнал (рис. 3). Метод SRC может быть совместно использован с любым существующим кодеком. В результате его первого объединения с MP3 был реализован алгоритм MP3PRO, значительно улучшивший исходный. Однако наиболее существенного приближения к исходному несжатому сигналу удалось достичь при объединении SRC с ААС. Этот вариант получил название aacPlus. Для случая передачи сжатой с помощью этого кодека аудиоинформации, например, при скорости 48 кбит/с, для передачи низкочастотной части используется 42 кбит/с, а на SRC-данные приходятся оставшиеся 6 кбит/с.
Coding Technologies
Одна из ведущих компаний в области разработки алгоритмов сжатия звука для специальных применений в системах с ограниченной скоростью передачи денных: мобильных телефонов, цифрового радиовещания и интернета. Эта частная компания основана в 1997 году в Стокгольме, Швеция, и в настоящее время имеет, кроме этого, отделения в Германии и США (в «силиконовой» долине). Среди купивших технологии, предлагаемые Coding Technologies, такие известные компании как Thomson Multimedia, Texas Instruments, а также осуществляющая цифровое радиовещание в США ХМ Radio и интернет-компания MusicMatch.
Благодаря своей эффективности в передаче качественного звука формат сразу получил достаточно широкое признание: он обеспечивает качество близкое к компакт-диску при стереопотоке 48 кбит/с, высококачественное стерео при потоке 32 кбит/с и качественный моносигнал при 20 кбит/с. А при потоке 128 кбит/с aacPlus обеспечивает передачу многоканального звука формата 5.1. Благодаря своим исключительным характеристикам SRC был выбран еще в 2001 году в качестве эталонной модели для технологии расширения полосы внутри MPEG.
При независимом тестировании качества восстановления сжатого сигнала, проведенным такими компетентными организациями как MPEG и Европейский союз радиовещателей (EBU), aacPlus превзошел все другие кодеки по такому показателю, как качество сигнала на бит. На графике приведены результаты слепого слухового тестирования различных кодеков интернет-звука специалистами европейского союза радиовещателей, проведенные в 2002 году. Эти испытания включали сравнение работы нескольких популярных кодеков с кодеком aacPlus при разных скоростях потока, в том числе 48 кбит/с, результаты для которого и приведены. Кроме того что aacPlus был признан явным победителем, специалисты EBU отметили, что SRC является в настоящее время единственным способом кардинального улучшения при компрессии звука.
В 2003 году MPEG определил окончательные спецификации для MPEG-4 High-Efficiency AAC - таково теперь официальное название aacPlus. Кроме того, в интересах цифрового радио и телевещания, а также индустрии звукозаписи предполагается стандартизировать MPEG-2 ААС LC Plus SRC. Это позволит системным операторам вне зависимости от используемого стандарта (MPEG-2 или MPEG-4 AAC) уменьшить необходимую полосу пропускания канала практически вдвое.

Рис. 3. Структура канала передачи сжатого сигнала с использованием SBR
Структура канала передачи сжатого сигнала с исполь

Новый кодек - не замена AAC, а расширяющее возможности его применения дополнение. Теперь уже MPEG-4 High-Efficiency AAC рассматривается в качестве основного звукового кодека для кодирования по стандарту MPEG-4. Его большим преимуществом является также двойная обратная совместимость: это возможность декодировать существующий контент, закодированный кодеком ААС, и уже отмеченная ранее совместимость с существующими ААС-декодерами. Это позволяет производителям аппаратуры и программного обеспечения сразу его использовать. Кроме того, библиотеки и исходный код для кодеров и декодеров MPEG-4 High-Efficiency AAC уже доступны в операционных системах Mac OS X, Win32, Linux, а также множестве DSP.
Кроме полного декодера НЕ-ААС для профессиональной и стационарной аппаратуры, усилиями Coding Technologies, NEC и Panasonic был разработан и вариант так называемого «маломощного» декодера. В этом случае требуется процессор с производительностью на 40% меньше, но потоки НЕ-ААС декодируются лишь с незначительными потерями качества звука. Такое решение позволяет максимально широко использовать и НЕ-ААС в мобильных телефонах и других портативных устройствах для воспроизведения качественного звука.

Использование данных материалов допускается только с разрешения автора.

Вступайте в закрытый клуб Pult.ru!
Подпишитесь на рассылку
и получите 500 бонусов 👋
Нажимая кнопку «Подписаться», я даю согласие на получение рассылок информационно-рекламного характера и обработку персональных данных.
Вы успешно подписаны!