Подписка на новости
E-mail
снять подписку

КОГДА ИСПОЛЬЗОВАТЬ ДИТЕР

Постоянно растет число аудиозаписей, произведённых в разрядности

            более 16 бит и с динамическим диапазоном, превышающим 100 dB. Так

            как финальным носителем готовых записей чаще всего является

            компакт-диск, то встает вопрос об уменьшении разрядности

            аудиоматериала до необходимых стандартных 16 бит. В качестве решения

            было предложено использовать алгоритмы нойз-шейпинга и дитера. Эти

            методы хороши тем, что привносимая ими в сигнал ошибка квантования

            находится в той части звукового спектра, в которой человеческое ухо

            нечувствительно к звуковым колебаниям. Данная статья объясняет, что

            успешное использование подобного способа понижения разрядности

            сильно зависит от конкретных условий и, собственно, от

            обрабатываемого музыкального материала. В результате, выбор

            конкретного механизма и параметров преобразования больше зависит от

            звукоинженера, выполняющего мастеринг, а не от каких-либо постулатов

            и советов учёных. В статье говорится также, что вопреки

            высказываниям некоторых компаний-производителей студийной аппаратуры

            и исследователей, не существует универсального алгоритма

            «психоакустического улучшения» звучания. Поэтому желательно, чтобы

            производители оборудования предоставляли клиенту широкий выбор

            разнообразных алгоритмов обработки. Тогда в процессе работы клиент

            сможет ориентироваться на получение  требуемого  результата.

            

            ВВЕДЕНИЕ

            Транкейт высокоразрядного цифрового сигнала до, предположим, 16 бит,

            приводит к ошибке в сигнале, которую нельзя исправить впоследствии.

            Более того, характер ошибки таков, что она значительно ухудшает

            качество звучания. Данная ошибка сильно модулируется сигналом,

            вызывая появление обертонов и маскируя полезный сигнал. Имеется

            множество различных способов уменьшения разрядности до 16 бит.

            Мы рассмотрим те варианты, которые схематически отображены на Рис.

            1.

            

            Рисунок 1. Общая блок-схема дитера с нойз-шейпингом. В случае дитера

            без нойз-шейпинга, F (z ) равняется нулю. При использовании лишь

            нойз-шейпинга, дитер равен нулю.

            Мы рассмотрим случаи, когда дитер является генератором случайного

            шума либо с функцией равномерного распределения вероятности одного

            наименее значащего бита в амплитуде, либо генератором шума с

            функцией треугольного распределения вероятности амплитуды удвоенного

            наименее значащего бита. Будем идентифицировать их как "ФРР" и

            "ФТР", соответственно. Существует четыре основных варианта указанной

            схемы, которые различаются следующим образом:

              Чистый транкейт. При этом дитер равен нулю и F (z) = 0. То есть,

              этот случай – обычное квантование. При этом округление может как

              происходить, так и не происходить.

              Простой дитер. В этом случае F (z) = 0.

              Нойз-шейпинг.  Тогда F (z) представляет собой некоторую ненулевую

              функцию фильтра, а дитер равен нулю.

              Нойз-шейпинг с дитером. Ни дитер, ни F (z) не равны нулю.

            В зависимости от конкретных условий, имеются различные причины для

            выбора того или иного варианта. В любом случае, наименее приемлемым

            способом при работе со звуком, выглядит чистый транкейт. В вариантах

            1 и 3 количество энергии в ошибке одинаково. В варианте 3

            используется фильтрация  для формирования спектра ошибки

            квантования, но это не уменьшает абсолютную энергию ошибки. В

            вариантах 2 и 4 добавляется шум дитера, что увеличивает абсолютный

            уровень шума на 3 dB . В варианте 2 ошибка будет представлять собой

            белый шум. Здесь не представлены все возможные сочетания, но

            указанные четыре варианта схемы наиболее распространены на практике.

            Назначение дитера заключается в добавлении некоторого шума, что

            нарушает корреляцию между ошибкой квантования и сигналом. ФРР делает

            первый момент ошибки некоррелированным, а ФТР делает

            некоррелированными первый и второй моменты ошибки. Очевидно, что

            другие функции распределения могут использоваться для

            рассогласования более высоких моментов ошибки, но в этой статье они

            не рассматриваются.

            

            ЧТО ПРОИСХОДИТ СО СПЕКТРОМ?

            Назначение нойз-шейпинга, как говорилось ранее, заключается в

            перемещении энергии шума в ту часть звукового спектра, где она будет

            наименее заметна для слуха. После такого объяснения можно придти в

            выводу о том, что идеальным вариантом шумового спектра будет тот, в

            котором амплитуда шума для каждой частоты расположена ниже порога

            слышимости.

            Необходимо только определить кривую равной громкости, а затем

            спроектировать фильтр F (z ), который будет точно воспроизводить эту

            кривую. И вот тут начинаются неприятности…

            

            ОТКРЫТИЕ ФЛЭТЧЕРА И МАНСОНА (FLETCHER-MUNSON)

            В 1932 году пара исследователей из Bell Laboratories решила

            выяснить, казавшуюся тогда таинственной, природу процесса слухового

            восприятия громкости синусоид на различных частотах и при разных

            уровнях громкости. В своем эксперименте они использовали ламповые

            генераторы и усилители для получения различных звуковых тонов,

            которые воспроизводились через единственный динамик [5]. Слушатели,

            участвующие в исследовании, располагались непосредственно перед

            динамиком. Перед исследователями стояла задача сравнения громкости

            звука на различных частотах. Результатом этих экспериментов стало

            появление серии кривых, изображённых на Рис. 2. Ниже приводятся

            копии рисунков из оригинального издания статьи.

            

            Рисунок 2. Репродукция графика кривых равной громкости,

            опубликованного в 1933 году Флэтчером и Мансоном [5]. Для измерений

            использовался сигнал, воспроизводимый единственным

            громкоговорителем, который располагался прямо перед слушателями.

            Сразу возникает вопрос, а соответствовало ли оборудование, доступное

            ученым в 1932 году, поставленной задаче? Вот  что говорят сами

            авторы экспериментов о гармоническом искажении сигнала:

                "Приемники были электродинамического типа и были расчитаны на

                воспроизведение обертонов примерно на 50 децибел ниже основного

                тона. На самых высоких уровнях, искажение от фильтров было

                сильнее, чем от приемников, но во всех случаях уровень громкости

                любого обертона был на 20 или более децибел ниже основного тона.

                Опыты с комбинированными тонами показали, что в этих условиях

                вклад обертонов в общий уровень громкости является

                незначительным."

            Хотя их вывод о том, что обертоны не влияют на конечный результат,

            возможно верен, уровень погрешности в психоакустическом эксперименте

            Флэтчера и Мансона сегодня совершенно неприемлем.

            Теперь обратимся к набору кривых, изображенных на Рис. 3. Они

            получены Стивенсом и Дэвисом [6]. На многих участках графика кривые

            отличаются от результатов Флэтчера и Мансона более чем на 10 dB. Эти

            кривые были получены при использовании только лишь наушников.

            Заметьте, что сложное поведение кривой на участке от 5 до 10 кГц,

            исчезает. Из этого можно сделать вывод, что изменяющееся поведение

            графика на участке выше 5 кГц, вызвано влиянием акустической среды,

            и не имеет отношения к механизму восприятия громкости ухом человека.

 

            

            Рисунок 3. Набор кривых равной громкости, полученный Стивенсом и

            Дэвисом [6]. В данном эксперименте использовались наушники.

            Проводилось множество других исследований с использованием все более

            совершенного оборудования, но все они лишь доказывают значительную

            зависимость результата эксперимента от положения динамика в

            пространстве, а также от свойств акустической среды. Поэтому мы

            делаем вывод о невозможности существования абсолютной кривой равной

            громкости, независимой от способа достижения звуком внутреннего уха

            человека. Даже такие простые операции, как воспроизведение звука

            через два динамика, расположенные правее и левее центра (например, в

            случае акустического окружения обычной жилой комнаты), могут

            изменить представленные на графике кривые более чем на 6 dB.

            Обратите внимание также на то, как сильно форма кривых меняется при

            переходе от одного уровня громкости к другому. Итак, нам необходимо

            выбрать одну из кривых для разработки необходимого фильтра

            нойз-шейпинга. Это означает, что мы должны определиться не только с

            акустической средой прослушивания (позиция громкоговорителей и

            слушателей в пространстве, естественная реверберация помещения), но

            и с конкретным уровнем громкости.  Таким образом можно придти к

            выводу, что не существует абсолютной кривой равной громкости,

            независимой от абсолютного уровня громкости. Спектрально

            промодулированный шум, неслышимый при одном уровне, станет различим

            при увеличении громкости. Следовательно, результирующая

            воспринимаемая нами громкость шума будет зависеть от полной

            амплитуды и от спектральной формы довольно сложным образом.

            Учитывая все вышесказанное, как мы сможем спроектировать фильтр

            нойз-шейпинга? Вообще говоря, корректно реализовать данную идею

            невозможно, так как заранее предугадать, как будет проводиться

            прослушивание сигнала, мы не в состоянии. И несмотря на это, сегодня

            при выпуске компакт-дисков используют нойз-шейпинг, и множество

            людей согласно с утверждением, что в большинстве случаев это дает

            положительный эффект.

            Даже при том, что имеется некоторая неопределенность в определении

            формы кривых постоянной громкости, надо признать, что соблюдаются

            некоторые общие принципы. Например, ухо человека является наиболее

            чувствительным в диапазоне частот от 1 кГц до 5 кГц. Вне этого

            диапазона чувствительность человеческого уха непрерывно снижается по

            мере удаления от границ диапазона. Так как имеется относительно

            немного критических при прослушивании участков в высокочастотном

            диапазоне, имеет смысл размещать основную часть энергии шума в

            области высоких частот. Любой фильтр нойз-шейпинга реализует именно

            такой механизм. Пример на Рис. 4 знакомит нас с тремя различными

            фильтрами нойз-шейпинга, полностью учитывающими вышеперечисленные

            особенности.

            

            Рисунок 4. График, отображающий три возможные Амплитудно-Частотные

            Характеристики дитера. Не существует способа определения «наилучшей»

            кривой. Выбор конкретной кривой будет чисто субъективным.

            Единственным способом решить, какой из фильтров использовать в

            работе, является прослушивание всех вариантов и выбор того фильтра,

            который звучит наилучшим образом в данном конкретном случае. В

            современной индустрии производства аудио компакт-дисков решение о

            выборе фильтра нойз-шейпинга обычно принимается инженером

            мастеринга.

            Имеется еще одно техническое соображение при выборе фильтра

            нойз-шейпинга. Это - возможная потеря динамического диапазона в

            результате использования алгоритма нойз-шейпинга более высокого

Главная   -   О лейбле   -   Релизы   -   Как попасть на сборник   -   Фото галерея   -   О Группах   -   Видео   -   Музыка   -   Статьи   -   Хип-Хоп Обои   -   Партнеры   -   Рекламодателям   -   Концертный отдел   -   Контакты   -   Где купить   -   PRO Продюсирование
Рэп рейтинг сайтов | рэп топ 100 Яндекс цитирования


Все права и документы опубликованные здесь являются собственностью владельца сайта и групп независимого лейбла "Волна Улиц Продакшн".
Незаконное копирование или использование информации преследуется по закону.
mastered by ВУ Дизайн © 2002-2015