Хью Робджонс. Стереолаборатория

Опубликовано в журнале Sound on Sound в ноябре 2010 года

Хью Робджонс

Все мы знакомы со стереозвуком. Казалось бы, что тут сложного: расставил звуковые источники вправо-влево – вот тебе и стерео. Однако, при микшировании часто приходится прибегать к манипуляциям, далеко выходящими за рамки обычного позиционирования звука между двумя динамиками. К примеру, зачастую требуется изменить баланс в стереосигнале, или сделать из монофонического источника стереофонический, или усилить ощущение стерео в каких-то вещах… К тому же, многие из этих процессов требуют от пользователя определённых компромиссов: к примеру, сделав очень широкие гитары, Вы рискуете потерять их при прослушивании в моно; и наоборот, сделав хорошую моносовместимость, можете получить слишком узкое звучание. В этой статье я постараюсь объяснить основы стереофонии, исследовать способы манипулирования стереофоническими файлами и обсудить возможные компромиссы. И начнём мы с небольшого исторического экскурса.

Интенсивностная стереофония

С некоторой натяжкой можно считать, что стереофоническое аудио (то есть, воспроизведённое через два канала) возникло в 1881 году, когда французские инженеры Адер и Пускас осуществили двухканальную передачу звука из оперного театра по телефонным линиям. Демонстрация проводилась на Всемирной электротехнической выставке в Париже. Однако, реальный базис двухканального стерео – такого, каким мы его знаем сейчас – был заложен в начале 30-х годов ХХ века благодаря новаторским работам Алана Блюмляйна и его коллег из компании EMI.

Алан Блюмляйн (Alan Blumlein) – крёстный отец современной теории стереофонического воспроизведения.

Блюмляйн видел, что сколько б громкоговорителей не использовалось, наши уши слышат сразу их всех. Следовательно, попытка воспроизвести различия во времени прибытия звуковых волн, захваченные раздельными микрофонами, становится весьма проблематичным занятием. Относительные расстояния между динамиками и слушателем внесут дополнительное смещение, что ещё больше затруднит создание точного стереообраза.

Он понял, что это «проблематичное» свойство человеческого слуха (оба уха слышат оба динамика), может стать полезным, если в исходном сигнале исключить разницу во времени, оставив только лишь различия в уровне (интенсивности) каналов. Таким образом, используя естественные различия во времени прибытия сигналов от громкоговорителей к каждому уху, можно одурачить слуховую систему, заставив её воспринимать разницу в интенсивности исходного сигнала как различия во времени прибытия. В итоге, удаётся создать правдоподобную и устойчивую стереокартину. 

Физические основы теории Блюмляйна: звук от громкоговорителя идёт к одному уху чуть дольше, чем к другому, поскольку имеется небольшая разница в расстоянии и действует теневой эффект от головы.

Система Блюмляйна на практике

 Значительное преимущество этой системы заключается в том, что она обладает великолепной врождённой моносовместимостью: объединяя оба канала, Вы получаете чистый монофонический микс без какой-либо нежелательной окраски. Чтобы получить при прослушивании правильный стереоэффект, должны выполняться довольно жёсткие требования к размещению громкоговорителей и слушателя. В зависимости от размеров колонок и комнаты, они должны располагаться в углах равностороннего треугольника со сторонами 2 – 4 метра. Сигналы от громкоговорителей достигают ушей и взаимодействуют друг с другом, что приводит к созданию нового комбинированного сигнала, имеющего идентичную волновую форму, но смещённого во времени. Чем громче звук, тем сильнее сдвиг, что создаёт мнимую разницу в прибытии звукового сигнала к каждому уху.

Если обе колонки воспроизводят одинаковые по громкости звуки, комбинации сигнала в обоих ушах идентичны. Таким образом, нет никаких воспринимаемых различий во времени прибытия звуковых волн, и слушателю кажется, что источник находится непосредственно перед ним (фантомный центр). Изменяя относительные уровни этих двух каналов, Вы создаёте мнимые временные сдвиги, что перемещает воспринимаемую картину к более громкой стороне. Чтобы полностью переместить звук в одну из сторон, обычно достаточно 12 – 16 dB разницы, хотя это значение и может немного изменяться в зависимости от остроты слуха и условий прослушивания.

Таким образом, чтобы создать иллюзию звукового источника, находящегося где-то на линии между двумя динамиками, требуется изменить соотношение уровней между каналами. Это можно сделать искусственно, пользуясь регулятором панорамы. Хотя, ничто не мешает захватить реальную пространственную информацию, осуществляя запись при помощи совмещённых микрофонных пар.

Однако, если вместо того, чтобы сидеть в вершине идеального равностороннего треугольника, слушатель отодвинется к одной из сторон, стереообраз быстро сожмётся и свалится к более близкому громкоговорителю, поскольку сигнал от него будет прибывать намного раньше. В итоге, естественная разница во времени прибытия сигналов полностью заглушит то, что было создано благодаря различиям в уровнях. 


Вверху: лучшее положение для прослушивания стереозвука. Голова слушателя и громкоговорители находятся в вершинах равностороннего треугольника. Внизу: перемещаясь ближе или дальше от идеальной позиции, Вы ухудшаете качество стереофонической картины.

Панорамирование

Теперь давайте рассмотрим способы управления стереообразом. Очевидная отправная точка – это обычный регулятор панорамы. Он был изобретён в 1938 году специалистами компании Disney в процессе работы над фильмом Fantasia, и первоначально назывался «панорамным потенциометром». Он представляет собой устройство с одним входом и двумя выходами, которое изменяет уровни сигнала, поступающего на каждый из выходов. Когда регулятор стоит в центральном положении, на обоих выходах присутствует одинаковый уровень. Поскольку нет никаких межканальных различий в уровне сигнала, то на выходе мы получаем изображение звукового источника, находящегося в фантомном центре. Вращая регулятор в какую-то сторону, мы уменьшаем уровень в одном из выходов, тогда как в другом он остаётся неизменным. Получающееся межканальное различие уровней заставляет источник перемещаться в стереополе, созданном громкоговорителями.

В стереоканалах вместо регулятора панорамы обычно используется регулятор баланса. Принцип работы этого устройства примерно таков: он перемещает центральные звуки, тогда как края остаются неподвижными (хотя их уровень может быть изменён).

Более сложный подход использует два регулятора, которые мы назовём абстрактными именами ‘Width’ (Ширина) и ‘Offset’ (Смещение). Регулятор ширины использует простую M/S-обработку и позволяет изменять протяжённость стереообраза. Центральные звуки остаются незатронутыми, тогда как края стереополя растягиваются или сужаются. Крайние положения обычно маркируются как «Narrow» или «Mono», и «Wide» или «Spread». Центральное положение обозначается как «Normal» или «Stereo».

Если ширина стереообраза уменьшена, то при помощи регулятора смещения можно изменить положение локального стереополя «суженного» источника в контексте общей звуковой картины. Он изменяет взаимный уровень обоих каналов (уменьшает один и увеличивает другой) и работает аналогично регулятору баланса. По сути дела, если ширина не изменялась (или увеличилась), то разницы между ними нет вообще.

Mid/Side

Ещё одна из революционных идей Блюмляйна – это технология Mid/Side (M/S). Она рассматривает стереосигнал не в виде самостоятельных правого и левого каналов, а в виде центрального и бокового элементов. Центральный сигнал (середина) – это монофоническая сумма правого и левого каналов. Здесь отображаются те звуки, которые есть в обоих. Боковой сигнал (сторона) отображает различия между этими каналами, и содержит элементы, влияющие на стереофонию и определяющие её.

Следовательно, баланс между центральным и боковым сигналами определяет ширину стереокартины. Если боковой сигнал полностью удалить, останется только лишь монофоническая сумма – и, зачастую, полученный звук будет не самым жизнерадостным. Например, если запись была сделана раздельной микрофонной парой или имеется смещение времени между каналами (например, вызванное неправильной настройкой азимута головок на магнитофоне), то моносигнал может звучать намного тусклее, чем оригинальное стерео. Используя сэмплы и петли, мы чрезвычайно часто сталкиваемся с этой проблемой, что снова возвращает нас к такому аспекту, как моносовместимость. 

Увеличение уровня бокового сигнала усиливает различия, что даёт эффект расширения стереополя: элементы, находящиеся по краям, становятся более доминирующими.

Стереозвук можно захватить и передать как в L/R-формате (левый/правый), так и в M/S (используется в FM-вещании и при изготовлении виниловых дисков). Кроме того, не составит особого труда преобразовать звук между форматами. Используется один и тот же процесс, называемый «амплитудно-фазовой матрицей. Формулы очень просты:

Mid = (left + right) - 3dB 
Side = (left - right) - 3dB
Left = (mid + side) - 3dB 
Right = (mid - side) - 3dB

Ослабление на 3dB – это опциональное действие. Оно нужно для того, чтобы полный процесс преобразования туда и обратно (например, L/R - M/S - L/R), не привёл к увеличению уровня сигнала. Многие матричные системы не используют в процессе преобразования это ослабление. Таким образом, может потребоваться ручное уменьшение уровня.

Самостоятельное создание M/S-матрицы

Многие DAW включают специализированные плагины, предназначенные для преобразования стерео в M/S-формат и обратно. Также имеется множество продуктов и от сторонних производителей – например, бесплатный Voxengo MSED. Кроме того, на рынке представлены и аппаратные средства. 


Использование специализированного программного или аппаратного обеспечения – самый лёгкий способ осуществить преобразование форматов. Тем не менее, подобную матрицу очень легко сделать вручную, пользуясь одним лишь только микшером (хоть настоящим, хоть виртуальным). Чтобы преобразовать формат L/R в M/S, нужно сделать две параллельные операции: суммировать каналы и вычесть. Суммирование – это именно то, чем, собственно говоря, и занимается микшер. Поэтому обсуждать здесь особо нечего. Чтобы сделать вычитание, надо изменить полярность (фазу) одного канала и затем смешать их вместе: если оба канала содержат одинаковый материал, то на выходе ничего не будет (поскольку нет различий); если же там есть какие-то различия, на выходе появится сигнал.

Первое, что надо сделать – это маршрутизировать входные каналы матрицы на пару шин (скажем, 47 и 48). Левый канал будет одинаков для обеих шин. А вот правый канал поступит на шину 47 в неизменном виде, а на шину 48 – с инверсией фазы.  Таким образом, шина 47 получает сумму левого и правого каналов (Середина/MID), а шина 48 – их разницу (Сторона/SIDE), поскольку сигналы туда приходят в противофазе.

Очевидно, что общий уровень определяется левым каналом, проходящим через обе шины. Хотя, в зависимости от конфигурации микшера, может потребоваться точная настройка уровней в каждой цепи, чтобы выходной сигнал матрицы не отличался по уровню от входа. Во многих случаях, при маршрутизации используется регулятор панорамы. Обычно, он несколько повышает уровень сигнала, панорамируемого в какую-то сторону, и понижает при возвращении к центральной позиции (об этом аспекте поговорим в конце статьи). В результате, общий уровень выходного сигнала матрицы может немного измениться. Таким образом, стоит проверить сквозной уровень, пользуясь референсными сигналами или чем-то подобным.

Точно такая же маршрутизация используется, чтобы сделать обратное преобразование. MID-сигнал напрямую поступает в левую и правую шины, тогда как SIDE-сигнал поступает в правую шину с инверсией фазы. Зачастую, полезно иметь дополнительный контроль над боковым сигналом, что позволяет оперативно изменять общую ширину стереокартины. Для этого необходимо сделать линкование обоих фейдеров бокового сигнала, чтобы синхронно изменять уровни прямого и инвертированного каналов.

Как уже упоминалось, регулятор ‘Width’ (Ширина) использует именно такую форму обработки. Оригинальный стереосигнал преобразуется в M/S-формат, уровень SIDE-сигнала соответственно уменьшается или увеличивается, и результат конвертируется обратно в L/R. Изменяя уровень SIDE-сигнала, Вы можете сузить воспринимаемый стереообраз (вплоть до моно), либо расширить. С расширением надо обращаться достаточно осторожно, чтобы ненароком не сделать «дырку» в центре стереокартины, что приведёт к рассредоточенному и довольно неприятному звуку. Уровень бокового сигнала не должен долговременно превышать уровень середины: когда оба сигнала равны, стереообраз занимает всю ширину между громкоговорителями. Дальнейшее увеличение бокового сигнала раздвигает звук за пределы динамиков. На первый взгляд, это звучит очень впечатляюще, но быстро вызывает проблемы с противофазой и моносовместимостью.

Mid/Side-обработка

M/S-формат очень полезен при обработке звука, поскольку он позволяет независимо манипулировать элементами, находящимися в центре и по краям стереопространства. Однако, нужно не забывать, что любой процесс, изменяющий относительные уровни центрального и бокового сигналов, также изменит стереоширину обрабатываемого источника. Вы можете воспользоваться этим, чтобы расширить стерео и сделать «отверстие» в центре, в которое можно поместить другой источник. К примеру, записывая акустическую гитару при помощи совмещённой пары микрофонов, Вы, скорее всего, получите стереообраз, в котором основная часть энергии сосредоточена в центре. Преднамеренно расширяя его, Вы сделаете отверстие, в которое можно будет усадить вокал. Это не только обеспечит голосу необходимую ясность, но и позволит гитаре быть более заметной в миксе. Здесь главное не перестараться: если раздвинуть её слишком широко, может пострадать моносовместимость.

M/S-обработка приобрела особую важность в 50-х годах, когда начался широкий выпуск стереофонических грампластинок. Так вот, MID-элемент стереосигнала определяет горизонтальное или боковое (lateral) отклонение канавки винилового диска, тогда как SIDE-элемент определяет вертикальное (vertical). Слишком большой уровень бокового сигнала может вызвать массу проблем, включая выброс иглы звукоснимателя из канавки.

Вы можете сказать, что всё это связано с физическими ограничениями винила. Тем не менее, актуальность всех этих вещей не уменьшилась до сих пор. Принуждая низкие частоты находиться в центре, Вы гарантируете, что их энергия будет равномерно распределена между обоими громкоговорителями. Подобная M/S-обработка (или ‘lateral and vertical’) была основным инструментом мастеринга на протяжении половины столетия. Если взять сегодняшний день, то мы также можем найти средства для создания монофонии в определённых частотных областях, встроенные в различные плагины. Например, это функция «mono maker» в некоторых продуктах от Brainworx, или специализированные процессоры типа Nugen Monofilter.

Ещё одно простое применение M/S-обработки – это редактирование стереосигнала, записанного с избыточным количеством реверберации. Обычно, захваченное эхо некогерентно, и существует, главным образом, в боковом канале. Понижая уровень SIDE-канала, можно значительно сократить количество слышимого эха. Кроме того, при помощи эквализации можно уменьшить наиболее заметные элементы реверберации, не сжимая при этом стереообраз. Есть множество плагинов, с той или иной степенью изощрённости предлагающих подобный вид обработки (снова вспоминаются продукты от Brainworx). Также на рынке присутствуют и аппаратные средства, такие, как Rupert Neve Designs Portico 5014 Stereo Field Editor, которые делают очень похожую работу.

Вообще, эквализация SIDE-сигнала – один из мощнейших инструментов обработки в этом формате. Например, повышая частоты в области 8 – 16 кГц, Вы добавляете ширину в самых высоких частотах, заставляя микс звучать более просторно, воздушно и открыто. Если обрабатываемый стереосигнал был захвачен при помощи совмещённых микрофонов или получен путём панорамирования мультитрековой записи, то стерео станет более широким, но при этом останется точным и чётко локализованным.

Однако, если стереосигнал записывался при помощи раздельных пар, то, усиливая боковой канал, Вы ещё сильнее размажете стереообраз. Это даст более широкое, но менее чёткое стерео. Многие люди не считают это особой проблемой, поскольку красочное звучание широкого стерео зачастую перевешивает отсутствие чёткой локализации.

Уменьшая в SIDE-канале низкие частоты, Вы сужаете ширину баса, что зачастую заставляет его звучать более связно и энергично (опять же, «узкий» бас – неотъемлемое требование виниловой записи). Если же повысить низкие частоты, то звук станет более просторным и натуральным. Тем не менее, желательно применять повышение не более 6 dB, используя полочный фильтр с частотой 250 – 600 Гц. И здесь Блюмляйн стал новатором, придумав процесс, называемый «Shuffling». Он преобразует маленькие фазовые различия в низких частотах, существующие между каналами, в различия уровня. Это ещё больше увеличивает ширину стереообраза. Данная техника очень хорошо работает с сигналами, записанными при помощи совмещённых пар микрофонов.

Вы можете использовать M/S-формат при динамической обработке своего микса. Это позволяет независимо изменять динамику центральных и пространственных звуков. Например, если ведущий вокал (который обычно находится в центре) является в миксе слишком громким, Вы можете независимо скомпрессировать MID-канал, что часто помогает изменить баланс, не потревожив более широкие звуки (гитары, подпевки или барабаны). Во многих случаях, здесь полезно использовать многополосный подход, чтобы ограничить частотный спектр обработки. Ещё одна методика, комбинирующая эквализацию с динамической обработкой – управление вокальными сибилянтами, что позволяет не затронуть блеск и ясность более широко звучащих тарелок, гитарных или клавишных партий.

Более сложный вариант M/S-обработки – это манипулирование фазовыми отношениями между MID и SIDE-каналами. Перемещая центральные источники вперёд или назад относительно боковых, Вы изменяете глубину воспринимаемой стереокартины. Подобная функциональность доступна не только в плагинах, но и в вышеупомянутом Portico Stereo Field Editor.

Искусственное стерео при помощи M/S-обработки

Есть несколько способов создания стереофонии из монофонических источников. И у каждого есть свои плюсы и минусы. Одно очень эффективное и полностью моносовместимое решение состоит в том, чтобы использовать монофонический источник как MID-канал, искусственно добавив к нему SIDE-канал. После дешифровки получится нормальный стереосигнал формата L/R.

Чтобы понять, как это работает, представьте певца, стоящего перед парой микрофонов в конфигурации M/S. MID-микрофон, который направлен непосредственно на человека, захватит прямой звук голоса (наш моноисточник). SIDE-микрофон (как Вы знаете, имеет направленность типа «восьмёрка» и расположен так, чтобы её половинки были направлены по сторонам) не захватит вообще никакого прямого звука, но зато поднимет отражения от стен комнаты.

Чтобы не углубляться в дебри, максимально утрируем процесс, считая, что главное различие между прямыми и отражёнными звуками – задержка. Отражённому звуку понадобится больше времени, чтобы достичь стены, отразиться и попасть обратно в микрофон.

Следовательно, чтобы создать простой искусственный SIDE-канал для монофонического источника, достаточно сделать задержанную копию исходного сигнала. Нормальная задержка – между 7 и 70 мс. Чем больше задержка, тем большим будет казаться помещение (потому что звуку понадобится больше времени, чтобы достичь стен и вернуться обратно). Хотя, убедительность эффекта достаточно сильно зависит от исходного звукового материала. 70-миллисекундная задержка будет, скорее всего, неплохо смотреться с оркестровой записью, но в случае с сольной акустической гитарой результат будет звучать совершенно неубедительно. Ещё раз повторимся: поскольку уровень SIDE-канала (относительно центра) определяет впечатление от общей ширины стереокартины, следует экспериментировать с временем задержки и уровнем. Вообще, чем сложнее спектр исходного звука, тем лучше работает эффект. Стоит сказать, что значительное преимущество этой методики состоит в том, что она обладает прекрасной моносовместимостью: суммируя обработанный сигнал в моно, Вы полностью удаляете искусственный SIDE-компонент, оставляя только оригинальный моноисточник.

Теперь давайте разберёмся, как вообще здесь возникает стереоэффект? Всё дело в том, что этот способ «нарезает» оригинальный звук на узкие спектральные компоненты и распространяет их через всё звуковое поле. Время задержки определяет, как будет разделён сигнал (то есть, самую низкую частоту, которая будет затронута), а уровень SIDE-канала определит, насколько широким будет это распространение. Основа этого процесса – пара чередующихся гребенчатых фильтров в левом и правом каналах. Матрица конвертирует M/S в L/R-формат, суммируя и вычитая MID и SIDE-каналы, и если Вы комбинируете сигнал с задержанной версией самого себя, то в результате получите эффект гребёнчатой фильтрации. 


Используя подобную схему, Вы можете создать искусственное стерео из монофонического источника. Полярность правого фильтрованного канала перевёрнута относительно левого, таким образом, при суммировании в моно искусственный сигнал полностью исчезает. Однако, оригинальный источник обеспечивает моносовместимость.

Задержка создаёт фазовое смещение, которое изменяется в зависимости от частоты. В низких частотах, имеющих длинную волну, смещение не очень велико. Поэтому, уровень низов в левом канале возрастёт (M+S), а в правом – уменьшится (M-S). Это предоставляет некоторые проблемы, о решении которых мы поговорим чуть позже. С повышением частоты задержка создаёт более выраженное смещение: пики исходного сигнала частично или полностью совпадают с впадинами задержанного, и наоборот. Таким образом, в результирующем спектре появляется ряд глубоких вырезов, напоминающих зубцы расчёски.

Поскольку задержанный сигнал для правого канала поступает с инверсией фазы, то и «гребёнка» также будет перевёрнута относительно левого канала: где у одной находятся вырезы, у другой будут пики. Это означает, что одни частоты появятся только в левом канале, а другие – только в правом. Наш одураченный слух интерпретирует это как сильно стёртую стереокартину. Конечно, здесь нет никакой информации о реальном расположении, но звучит это очень эффектно.

Неприятный побочный эффект – усиление низких частот в левом канале (из-за суммы реального MID и искусственного SIDE-каналов) и полное отсутствие в правом (в результате вычитания). Задержка, используемая при создании искусственного бокового сигнала, обычно слишком мала, чтобы привести к значительным изменениям фазы низких частот. Поэтому, в левом канале происходит практически полное сложение низкочастотных сигналов, а в правом – практически полное вычитание (говорю практически, поскольку небольшая разница фаз здесь всё-таки присутствует). В итоге получается весьма кривая стереокартина. Однако, решить эту проблему очень просто: достаточно обработать искусственный боковой сигнал обрезным НЧ-фильтром, чтобы не было никакого стерео в низких частотах и весь бас остался зафиксированным в центре. Фильтр с частотой среза около 100 Гц обычно работает очень хорошо. 

Искусственное стерео при помощи реверберации и задержки

Ещё один способ создания искусственного стерео – это использование реверберации. Основная идея позади этого метода состоит в том, что большинство музыкальных инструментов имеет слишком малые габариты, чтобы слушатели, находящиеся на расстоянии более нескольких футов, смогли ощутить их размеры. В данных случаях, ощущение стереофонии создаётся благодаря отражениям комнаты. Их то мы и сможем сымитировать при помощи процессоров-ревербераторов.

Если Вы настроите пэтч, в котором имеются очень сильные ранние отражения и отсутствует реверберационный хвост (или он уменьшен до минимума), то сможете получить очень убедительный стереоэффект. В идеале, хвост должен отсутствовать полностью. Моносовместимость этого способа должна быть довольно неплохой, хотя, скорее всего, при суммировании останутся некоторые призвуки реверберации. Баланс между сухим звуком и эффектом определит перспективу (насколько далеко будет находиться источник), а состав ранних отражений определит, насколько большой будет комната.

Кроме того, можно использовать короткую задержку. Её можно получить не только при помощи соответствующих процессоров, но и просто копируя и сдвигая дорожки внутри DAW. Используется задержка в диапазоне 5 – 15 мс. Естественно, оба канала надо развести по панораме. Однако, при моносуммировании, комбинация оригинального и задержанного сигнала приводит к эффекту гребёнчатой фильтрации, что зачастую очень сильно окрашивает звучание инструмента. Чтобы минимизировать проблему, можно уменьшить уровень задержанного канала или использовать несколько задержек с разными параметрами. Однако, всё это ослабляет впечатление от стерео.

Измерение

 Легко увлечься расширением стереобазы и, в итоге, получить звук, абсолютно не имеющий никакой моносовместимости. Проблемы могут быть разными: от умеренной окраски, ухудшения баланса или тонких «фазовращательных» эффектов, до полного пропадания некоторых инструментов. Таким образом, на всех этапах производства следует проверять моносовместимость своего материала: регулярно нажимайте кнопку «МОНО» в микшере или в процессоре, и тщательно прислушивайтесь к любым побочным эффектам обработки.

В процессе работы используйте измерители фазы между правым и левым каналами. Есть два основных типа таких приборов: стрелочный фазокоррелометр и стереогониометр, по сути, представляющий собой осциллограф, показывающий фигуры Лиссажу. Обе разновидности доступны как в виде аппаратных устройств, так и в виде плагинов. Самый простой – это фазокоррелометр, имеющий шкалу, маркированную от 1 до -1 и разделённую посередине нулём. В принципе, он не всегда является стрелочным прибором. Сейчас распространены измерители, выполненные в виде ряда светодиодов (или а-ля газоразрядная трубка). Область от 0 до +1 обычно окрашивается в зелёный цвет, область от 0 до –1 – в красный. Принцип работы его примерно таков: он осуществляет умножение сигналов, а затем интегрирует произведение. Прибор должен действовать независимо от входных уровней сигналов. С этой целью сигналы предварительно проходят через ограничители. Для умножения сигналов применяется кольцевой балансный модулятор. Время интеграции интегрирующей цепочки выбирается с расчетом, чтобы оно было больше наибольшего времени T, свойственного сигналу, как стационарному процессу. Проинтегрированное за время T произведение сигналов, пропорциональное коэффициенту корреляции, регистрируется прибором

Фазокоррелометр.

 Если левый и правый каналы одинаковы (то есть, это моноисточник), то между ними нет никаких фазовых различий, и измеритель покажет +1. Говоря более научным языком – оба канала полностью когерентны (коррелированны). Уменьшая когерентность (то есть, вводя стереофонию), Вы увидите, что стрелка начнёт колебаться в диапазоне от нуля до +1. Колебания стрелки прибора в зоне, близкой к нулю, означает отсутствие корреляции между правым и левым сигналами. В этом случае звучание, сохраняя моносовместимость, воспринимается наиболее стереофоническим, с широкой стереобазой.

Структурная схема фазокоррелометра.

Если у обоих каналов будут одинаковые элементы, находящиеся в противофазе, то стрелка начнёт попадать в красную зону, приближаясь к значению -1. Если стрелка полностью отклонится к -1, это означает, что оба канала полностью идентичны, но имеют противоположные полярности (фазы). Незначительные «залёты» в красную зону обычно не предоставляют проблем, но если стрелка долгое время находится ниже нуля или отклоняется до -1, это означает, что у Вас серьёзные проблемы с противофазой и моносовместимостью. Таким образом, наша цель – так сформировать сигнал, чтобы измеритель фазы находился близко к нолю, но при этом не переходил в красную зону. Именно тогда у Вас будет максимальная ширина стереобазы с прекрасной моносовместимостью. 

Одно из исполнений гониометра

Еще большей информативностью по сравнению с фазокоррелометром обладает стереогониометр. Это прибор в основном состоит из осциллоскопа без блока временной (горизонтальной) развертки и двух усилителей горизонтального и вертикального отклонения луча электронно-лучевой трубки. Усилители прибора имеют автоматическую регулировку усиления (логарифмирование), что позволяет наблюдать за разностью фаз в большом динамическом диапазоне сигналов. Перед усилителями включен блок суммирования и вычитания входных сигналов (суммо-разностный преобразователь).

Принцип действия прибора следующий. На два входа подаются сигналы A и B, которые суммо-разностным преобразователем преобразуются в сигналы A+B = M и A-B = S. Далее, суммарный сигнал M подается на пластины вертикальной развертки электронно-лучевой трубки, а разностный сигнал S - на пластины горизонтального отклонения.

Итак, что же показывает нам сиё чудо техники? Если сигналы в обоих каналах одинаковы (моно), то на дисплее мы увидим прямую вертикальную линию. Если сигнал имеется только лишь в левом канале, то линия будет отклонена на 45° влево. Если сигнал имеется только лишь в правом канале, то линия будет отклонена на 45° вправо. Длина линии отображает амплитуду сигнала. При подаче на вход прибора сигналов реальной стереофонической программы, изображения на экране приобретают более сложный вид, соответствующий непрерывным изменениям сигналов A и B во времени.

Эти примеры демонстрируют, что происходит с гониометром, когда Вы изменяете ширину стереобазы. Используется бесплатный плагин Flux ST Tool. На первом рисунке показан источник с узким стереополем: «туманность» сосредоточена в области +1. На втором рисунке показан источник с полным заполнением стереопространства: «туманность» равномерно распределена по всем измерениям. И на последнем рисунке изображена слишком широкая стереобаза: «туманность» расплющена по горизонтали, сосредотачиваясь, в основном, в отрицательной зоне. Это верный признак того, что при суммировании в моно некоторые частоты будут потеряны.

При наличии некоторого опыта, по «картинкам» на экране можно определить правильность передачи звуковой картины, распределение направлений на отдельные виртуальные источники, наличие или отсутствие баланса, фазовые соотношения и моносовместимость. Например, я часто пользуюсь гониометром, настраивая угол между микрофонами в совмещённой паре. Это гарантирует, что звуковые источники будут иметь необходимую стереоширину.

Пользуясь этим измерителем, Вы сможете быстро обнаружить проблематичные элементы. Например, слишком широкие гитары или подклады предстанут в виде эллипса, ориентированного по горизонтали. Если источник слишком далеко панорамирован от центра, то это станет видно по наклону эллипса в ту или иную сторону. Тонкие эффекты, зачастую плохо различимые слухом, ясно выделяются на дисплее гониометра. Благодаря такой информации, Вы можете отредактировать проблемный источник или использовать другую обработку. 

Характерные изображения на экране гониометра

Stereo Pan Law

Есть несколько «законов» или правил, которые определяют соотношение между углом поворота регулятора панорамы и уровнем сигнала. Важные аспекты этих правил – это фактический выходной уровень каждого канала при центральном положении регулятора, плюс опциональное понижение на 3, 4,5 или 6 dB. 

При панорамировании всегда происходит изменение уровня. Чтобы избежать связанных с этим проблем, были разработаны различные правила выполнения этой операции.

 Вы можете спросить: зачем нужно несколько вариантов ослабления? В системах, где моносовместимость критически важна (например, на радио), требуется обеспечить постоянство уровня при перемещении источника по звуковому полю. Когда он находится в центре, то его уровень в обоих каналах одинаков, и при моносуммировании произойдёт их электрическое сложение. Это приводит к увеличению уровня на 6 dB. Таким образом, чтобы уровень полученного моносигнала был постоянен и не зависел от панорамы, центральное положение регулятора должно уменьшать оба выхода на 6 dB относительно крайних положений. Это называют законом постоянной величины напряжения.

Есть несколько способов изменения уровня. Первый: уровень оригинального сигнала не изменяется в крайних положениях, и прогрессивно уменьшается при перемещении к центру. Второй: в центральном положении сохраняется оригинальный уровень, а при перемещении к любому краю происходит усиление. Кроме того, в некоторых случаях используется комбинация обоих. Есть плюсы и минусы в каждом подходе, но самый важный аспект в том, что уровень в центральном положении уменьшен относительно краёв.

Как мы увидели, чтобы получить идеальную моносовместимость, требуется ослаблять на 6 dB уровень источников, панорамированных в центр. Однако, когда мы слушаем громкоговорители, то их выходной сигнал объединяется акустическим путём (а не электрическим), и это подразумевает, что требуется уже другое количество ослабления. Если мы воспроизведём один и тот же сигнал через обе колонки, то воспринятый уровень увеличится примерно на 3 dB по сравнению с одним громкоговорителем. Таким образом, чтобы обеспечить постоянный воспринимаемый уровень, достаточно только лишь 3 dB ослабления, а не 6. Это называют законом постоянной мощности.

Современные DAW позволяют пользователям выбирать нужное для конкретной задачи правило панорамирования. Однако, в случае с аналоговыми микшерами, будет не самым практичным решением снабжать их всеми возможными разновидностями панорамизаторов. Таким образом, на протяжении многих десятилетий, производители прибегали к компромиссу, используя для центральных источников ослабление 4,5 dB. Если Вы будете слушать сделанную в микшере моносумму, то сможете заметить небольшую «выпуклость» на 1,5 dB. А при внимательном прослушивании в стереоколонках, можно заметить маленькую ямку (излишнее понижение уровня). Практически, величина ошибки при таком суммировании крайне незначительна, и мало кто способен её заметить. Тем не менее, полезно знать действие каждого правила, и как они влияют на баланс источников при прослушивании в стерео и моно.

Некоторые аспекты динамической обработки

Обычно, при использовании таких динамических процессоров, как компрессоры и ограничители, важно, чтобы уровень подавления в правом и левом каналах был тождественен. Это достигается при помощи такой функции, как «Stereo Link», которая гарантирует, что управляющие напряжения, сгенерированные детекторными цепями, будут одинаково применены к каждому каналу.

Благодаря этому, компрессор синхронно изменяет уровни обоих каналов, не оказывая влияние на стереокартину. Однако, если каналы компрессора никак между собой не связаны, то может произойти следующее: например, в самом краю левой стороны появляется слишком громкий звук и компрессор начинает подавлять уровень левого сигнала, тогда как правый канал вообще на это никак не будет реагировать. В результате, центральные источники (у которых должен быть одинаковый уровень в обоих каналах), начинают перемещаться в правую сторону, поскольку её уровень будет выше, чем у компрессированного левого канала. Когда компрессор перейдёт в фазу восстановления, картина начнёт перемещаться обратно к центру. Очевидно, что подобная раскачка стереообраза нежелательна.

А вот при динамической обработке в M/S-формате, цель как раз таки состоит в том, чтобы независимо манипулировать центральным и боковым сигналами. Таким образом, линкование каналов здесь обычно не применяется. Так, если сжать MID-канал, не трогая SIDE, то, после преобразования в L/R-формат, стереосигнал приобретёт своеобразное дыхание: ширина стереобазы будет пульсировать в зависимости от количества подавления, приложенного к MID-каналу. К счастью, большинство людей совершенно не чувствительно к подобным изменениям стереокартины, и ощущает только лишь изменённую динамику, которая даёт эффект изменения баланса между центральными и боковыми звуками.

Как мы слышим стерео

Собственно говоря, эту главу следовало бы поместить в начало статьи, поскольку, прежде чем рассматривать различные способы обработки стереофонического материала, надо бы понять, как мы воспринимаем стереозвук. Хоть человеческая слуховая система и оборудована всего лишь двумя звуковыми приёмниками, мы, с той или иной степенью точности, способны определять положение звуковых источников, находящихся в любом направлении. Это возможно благодаря комбинации трёх основных методов: анализ фазовых и временных различий, анализ различий уровня и спектральный анализ.

Первый «метод» использует разницу в прибытии звука в каждое ухо. Звуковой волне требуется примерно 3,4 мс, чтобы преодолеть расстояние 1 метр. Таким образом, если источник не находится непосредственно спереди или сзади, волна придёт к одному уху чуть позже, чем к другому. Среднее расстояние между ушами взрослого человека – 15 см. Поэтому, наибольшее различие между прибытиями звуковой волны – 0,5 мс. На практике, большинство людей способно определять положение источника (в горизонтальной плоскости по фронтальному направлению) с точностью до 2°. Это соответствует различию во времени менее чем 0,01 мс!

Чтобы точно определить это время, мозг использует в качестве контрольной точки богатый переходными процессами (транзиентами) фронт звуковой волны. Обычно, большинство звуков содержит много подобной переходной информации, что и даёт возможность вычислять изменения во времени прибытия. А вот если звук не содержит переходных процессов (транзиентов), различие не может быть вычислено. Это доказано экспериментально: люди не могли определить месторасположение источника непрерывного тонального сигнала.

Различия во времени дают информацию о том, где относительно головы расположен источник – слева или справа. Но они ничего не говорят о том, находится ли он спереди или сзади. Звуковые волны от источника, находящегося под углом 45° (спереди справа) прибывают с такой же временной разницей, что и от источника под углом 135° (сзади справа). Эта двусмысленность решается при помощи маленьких неосознаваемых движений головы. Слегка вращая и наклоняя её, мы изменяем время прибытия к каждому уху. Например, если источник находится впереди, то вращая голову вправо, мы уменьшаем различие во времени прибытия, а если сзади – увеличиваем.

Если Вы неспособны двигать головой, то практически невозможно сказать, спереди или сзади находится звуковой источник. Это может быть причиной, почему многие люди с трудом воспринимают достоверность фронтальных звуков при прослушивании в наушниках бинауральных записей: движения головы не предоставляют дополнительной информации о времени прибытия, и поскольку Вы не видите источник перед собой, то мозг решает, что он должен быть сзади. Роль зрения не должна недооцениваться, поскольку глаза – это доминирующий орган чувств у большинства людей, и способность слуховой системы к локализации (звукопеленгации) служит, в основном, для того, чтобы направить наши глаза на источник звука. Таким образом, если Вы не видите его перед собой, возможно, он находится сзади!

Если механизм определения задержки полагается на транзиенты, которые, в основном, состоят из высокочастотных компонентов, то как мы можем определять местонахождение низкочастотных источников? Для этого используется различие фазы между звуками, достигающими каждого уха. Фазовые различия, обусловленные габаритными размерами головы, становятся неоднозначными для частот выше 2 кГц, поскольку, обегая вокруг головы, звуковые волны получают смещение, большее, чем 360°. Таким образом, смещение 20° будет интерпретироваться точно так же, как 380, 740 или 1100 градусов. Однако, у низких частот звуковая волна является настолько длинной, что продолжительность пути вокруг головы перестаёт иметь значение, и на первую роль выходят фазовые различия.

Однако, внутри закрытого пространства (например, типичной домашней или проджект-студии), низкочастотные отражения и стоячие волны создают дополнительные различия фаз между ушами, и изменения эти достаточно непредсказуемы и противоречивы. В результате, эти противоречия лишают нас возможности определить направление на низкочастотный источник. Так, можно довольно точно локализовать источник, находящийся на улице, но практически невозможно – находящийся в закрытом помещении. Это свойство человеческого слуха активно используется в акустических системах с дополнительным басовым громкоговорителем. Сабвуфер можно установить в любое место комнаты, и это не окажет никакого пагубного влияния на общую стереокартину.

Второй механизм, используемый для задач звукопеленгации – анализ различий интенсивности звуков, попадающих в оба уха. Интенсивность уменьшается с расстоянием, и это падение составляет примерно 6 dB с каждым удвоением «пробега». Однако, только лишь один этот факт имеет небольшую ценность, поскольку расстояние между ушами обычно намного меньше, чем расстояние между источником и каждым ухом. Таким образом, различия уровня, обнаруженные ушами, будут чрезвычайно малы. К примеру, источник, находящийся на расстоянии 4 метра и смещённый на 30° (в любую сторону), создаст между ушами различие уровня всего лишь 0,2 dB, что совершенно не обнаружимо человеческим слухом.

Тем не менее, здесь на помощь приходит ещё одно полезное акустическое свойство. Когда длина волны меньше, чем габариты объекта, помещённого на её пути, то возникает такое явление, как «звуковая тень»: область за объектом с резко пониженной интенсивностью звука. Наша голова создаёт звуковую тень для частот выше 2 кГц, и это усиливает различия уровня для любого источника, не находящегося непосредственно впереди, сзади или сверху. Эффект затенения усиливается с увеличением частоты, достигая примерно 20 dB в области 15 кГц. Кроме того, в частотах выше 7 кГц, ушные раковины создают тень для звуков, прибывающих сверху и сзади. Опять же, маленькие неосознанные движения головой помогают усилить информацию о направлении, полученную при помощи анализа этих высокочастотных теневых эффектов. Поворачивая голову, мы увеличиваем или уменьшаем теневой эффект для каждого уха.

И последнее оружие в нашем арсенале – это спектральный анализ. Человеческая слуховая система способна выявлять определённые пики и провалы в спектре полученных звуков, вызванные гребенчатой фильтрацией в результате интерференции со звуковыми волнами, отражёнными от наружного уха (ушная раковина и наружный слуховой канал) и плеч. Форма этой фильтрации зависит не только от источника, но, что более важно, от особенностей строения наружного уха. Таким образом – это очень «личный» механизм пеленгации, и одна и та же форма спектра у разных людей может обозначать совершенно разные направления. Эта техника не особенно точна, но она реально помогает удалить двусмысленности в других механизмах.

Примеры из реального мира

Есть много коммерческих треков, в которых можно услышать не только интересные манипуляции со стереополем, но и значительные изменения тональности и нежелательное окрашивание при прослушивании в моно. Ниже я представлю несколько примеров.

Madonna: ‘Vogue’ (альбом Immaculate Conception).
Главным образом, этот альбом содержит хиты Мадонны, пересведённые при помощи системы Archer Q Sound (теперь называется QSound Labs). Благодаря ей, можно получить трёхмерную звуковую картину, пользуясь только лишь обычной стереофонической акустикой. Эта технология производит большое, широкое и выразительное стерео, но при прослушивании в моно даёт не самый лучший, или даже неприятный, звук. В ‘Vogue’ есть огромные клавишные подклады, тональность которых значительно (и далеко не к лучшему) меняется в моно. Многие другие инструменты также меняют свою тональность в плохую сторону, причём, это касается и некоторых вокальных линий и перкуссии.

Eurythmics: ‘Ball and Chain’ (альбом Be Yourself Tonight).
Посередине этого трека есть место, где главный мотив начинает вращаться вокруг слушателя. Этот эффект очень сильно звучит в наушниках, да и в колонках он тоже не менее выразителен. Однако, слушая в моно, Вы сразу заметите, что громкость трека начинает циклически падать чуть ли не до нуля. Причина в том, что этот вращающийся эффект был получен благодаря скоординированной комбинации автопанорамы и инверсии фазы. Именно последняя и ответственна за понижения уровня в те моменты, когда регулятор панорамы проходит через центр!

Nirvana: ‘Smells Like Teen Spirit’ (альбом Nevermind).
Трек звучит очень впечатляюще, но если Вы сравните его с моноверсией, то заметите, что тональность гитар значительно меняется, и имеется явное ослабление высокочастотных гармоник.

В принципе, для всех этих песен моноверсия слушается достаточно приемлемо, но звуковое качество или характер определённо страдают по сравнению со стереофоническим оригиналом. Но это хорошие примеры того, как звукоинженер, продюсер или артист решили пожертвовать моносовместимостью в пользу интересной и эффектной стереофонии.

Опубликовано в журнале Sound on Sound в ноябре 2010 года

При подготовке статьи также использовались материалы из журнала "Звукорежиссер"

Перевод подготовил Бережной Вячеслав
www.unisonrecords.org


Загрузка беседы