#1
Отправлено 02 Ноябрь 2012 — 16:05
Уважаемые коллеги,вот о чём хотелось бы подискутировать: зачастую мы имеем дело со звуком,сделанным не нами и не в наших студиях,часто бывает,что компрессоры у дикторов настроены «агрессивно»,некоторые же предпочитают обрабатывать программно.Звукорежиссёры,как правило,используют при изготовлении рекламы стандартную цепочку плагинов и обработок.И тут то начинают появляться косяки.Косяки с согласным «П»,»Т»,»К»,»Д»..Часто из-за перекомпрессии на этих согласных при обработке получается такой воздушный пинок,и вместо буквы звучит неприятный щелчок.А ведь хочется компрессора то ещё и ещё крутануть!!!!Ролик то мощный!!!!
Или бывает случай,когда пишем близко к мику.Компрессии чуть добавил и буква «П» уже звучит с воздухом,черезчур грязно и громко,а хочется то ближней дистанции…
Это всё не касается «дорогих» трактов,да и с ними,бывает гемора много…
Кто как исправляет эту проблему согласных?
Всем спасибо за участие в обсуждении))
Для примера прилагаю два файла,в обработанном — результат гемороидальных телодвижений и работы над звуком,в необработанном — проблемные согласные,о которых я писал выше.Звук был записан на студии Soundfront,диктор — Стас Концевич.
- Наверх
#2
Андрей Петеляев℗
Отправлено 02 Ноябрь 2012 — 16:26
А по-моему, так «Необработанный голос.mp3 » — уже чем-то или кем-то обработанный.
Компрессор в нем, как насос, работает
- Наверх
#3
Юрий Юсим
Отправлено 02 Ноябрь 2012 — 16:41
работает моя обработка.я имею ввиду необработанные согласные
- Наверх
#4
alendr
Отправлено 02 Ноябрь 2012 — 18:05
ну тут да, «необработанный» уже хорошо прокачанный :D/>
- Наверх
#5
Андрей Петеляев℗
Отправлено 02 Ноябрь 2012 — 18:37

работает моя обработка.я имею ввиду необработанные согласные
Так надо исходник выложить — чтоб в «молоко» не пулять..
- Наверх
#6
berau
Отправлено 02 Ноябрь 2012 — 19:49
Мне кажется, это, конечно, не вообще любая компрессия так «пэкает», а компрессия с длинноватой для этого применения атакой. Я в таких случаях, во-первых, срезаю все крайние низы — они видны глазом на гласных после П, а затем не прибегаю ни к каким ухищрениям или плагинам, а просто прибиваю эти пэ вручную, каждую. Быстрее выйдет. Обычным форжевым (или каким угодно) фэйд-ином. При этом грубость в смысле резьбы по «драгоценному» комнатному эху — нафиг не имеет никакого эстетического значения.
- Наверх
#7
Юрий Юсим
Отправлено 02 Ноябрь 2012 — 20:01
Вот,блин,тоже вручную каждую проблемную букву.обработанный звук выложил как раз потому что есть цепь плагинов,которую хотелось сохранить,при этом устранить проблему.как я уже говорил,у всех свои примочки и для каждого роляса выстраивать свою неповторимую и уникальную последовательность эффектов -бред.подстраивать ручки-с удовольствием.хотя,можно при желании для проблемных трактов сделать свою «матрицу»?)))))
сырой материал выложу
Сообщение отредактировал Витамин (Юрий Юсим): 02 Ноябрь 2012 — 20:07
- Наверх
#8
berau
Отправлено 02 Ноябрь 2012 — 20:57
Ох, Юрий, я думаю, это утопия. Это как карта местности, годная для любой местности :)/>
- Наверх
Сведением называется процесс соединения различных звуковых «дорожек» в единую целостную картину/трек.
Сведением голоса/вокала/речи называется приведение в целостную картину записанных голосовых партий и как результат — студийная акапелла.
Говоря простыми словами, как же всё таки из записанной «какашки» сделать «конфетку», или хотя бы завернуть эту какашку в красивую обёртку)))
//// Итак, начнём с общего)))
////
Я разделил процесс сведения на 5 составных частей, в каждой части мы работаем с различными параметрами звука:
1. Громкость (Динамическая обработка)
2. Работа с частотными составляющими звука (Эквализация)
3. Пространственная обработка
4. Высота звука
5. Временные характеристики
Первые 3 процесса относятся к обработке и осуществляются использованием VST-плагинов или «железа»
1. Динамическая обработка — это управление громкостью звука. Есть 2 пути корректировки громкости — Ручной и Компрессия.
Ручной — нормализация всех дорожек, а так же нормализация плохо слышимых в миксе фраз, слов или даже слогов. Обычно делается на слух или по анализатору смотрится значение RMS, громкость каждого фрагмента должна быть адекватно ровной.
Компрессия — это автоматическое изменение громкостли звука по заданному закону. Компрессор автоматически делает громкие места тише.
Объясняю для чего нужен компрессор. В цифровом звуковом тракте суммирование нескольких сигналов попросту говоря
происходит так: на частоте f встречаются 2 сигнала, и тот, который громче, будет «маскировать» или закрывать собой тихий сигнал. В итоге в миксе между сигналами идёт автоматический дисбаланс — мы не можем услышать тихие составляющие сэмпла, потому что их закрывает другой сэмпл.
Например, возьмём инструменты Strings и Piano.
Пианино имеет острую атаку и быстрый спад по громкости, в то время как скрипки звучат постоянно и по громкости более-менее ровные. Получается, что если смешать пианино и скрипки, мы будем слышать только атаку пианино, а всё остальное в промежутках между нотами будут маскировать скрипки, + тихие места в пианино мы плохо услышим. Чтобы сигналы суммировались правильно, они должны быть равномерно близки по громкости. Подняв максимайзером тихие составляющие пианино мы улучшим прослушиваемость пианино в миксе. Так же компрессия используется для увеличения плотности звука, придаёт звуку насыщенность и конкретность. Перекомпрессированный звук звучит зажато и некачественно.
Что касается голоса, то здесь всё ещё сложнее. Микрофон воспринимает голос в неискажённом естественном динамическом диапазоне, а это означает, что тут будут и очень тихие и очень громкие моменты. Причём даже одно сказанное слово может сильно различаться по громкости своих слогов! Поэтому в начале списка обработки одним из первых должен стоять компрессор.
Параметры компрессора (Compressor):
Treshold — порог срабатывания — начиная с этого значения и выше до 0dB, компрессор будет делать звук тише.
Ratio- отношение (во сколько раз нужно делать тише)
Attack — атака — время срабатывания компрессора после достижения порога.
Release — время отключения компрессора после того как сигнал вышел из пороговой зоны.
К приборам динамической обработки, кроме обычного компрессора, так же можно перечислить:
Лимитер (Limiter) — не пропускает сигнал по громкости выше заданного значения (ratio=бесконечность или большое число).
Экспандер (Expander) — делает тихие места ещё тише (ratio<1).
Максимайзер (Maximizer) — повышает громкость тихих составляющих, но не трогает громкие.
Многополосный компрессор (Multiband compressor) — компрессирует отдельные области частот. Например Low-Mid1-Mid2-High — четырёх-полосный компрессор.
Де-Эссер (De-Esser) — компрессирует область высоких частот от заданного значения. Помогает от режущих шипящих звуков.
Де-Попер (De-Popper) — компрессирует область низких частот до заданого значения. Помогает от дефектов с взрывными согласными (П/Б)
Гейт (Gate) — заглушает значения ниже выставленного порога.
Но не стоит торопиться ставить компрессор первым эффектом — для начала нужно подготовить и очистить сигнал.
Первым эффектом должен стоять Parametric EQ, на нём нужно вырезать зону низких частот от 20 до 90-120Гц (если на вашем микрофоне есть кнопочка «-6dB»/»-16dB»/»-24dB», то, включив её, можно не ставить первым Parametric EQ, но на моей Октаве такой кнопочки нету…)
Тем самым мы избавимся от лишних ненужных низкочастотных составляющих сигнала, таких как фон аппаратуры, резкая буква П и Б, срез низких на канале голоса — это стандартная операция.
Потом можно поставить Gate — уберем ненужный шум в промежутках между фразами.
Следующим эффектом в нашей цепочке должен стоять Waves De-Esser, так как пока сигнал не закомпрессирован, Де-Эссер легко
найдёт «запирающие» шипящие места и выровнит их. Значение Де-Эссера я всегда ставлю на слух, а иногда обхожусь и вовсе без Де-ессинга.
Следующий эффект — долгожданный компрессор. С его помощью мы делаем тише громкие места. Обычно мои настройки такие:
Ratio — от 2.5 до 4
Treshold — от -5dB до -11dB
Атака 15мс, релиз 50мс.
2. Эквализация. Следующий эффект после компрессора — Parametric EQ. Но для начала чуть-чуть о хитростях частотной обработки голоса.
Эквалайзер — прибор, управляющий мощностью сигнала на заданных частотах.
Человек слышит от 20Гц до 20 000Гц. Диапазон человеческого голоса зависит от самого тембра. У мужчин примерно от 100Гц, у женщин примерно от 200Гц.
Так же частотные составляющие вокала/речи зависят от взятой ноты. У речетатива нет конкретных нот, высота меняется в зависимости от интонации. Но есть в природе такой закон: частотный спектр голоса состоит из гармоник и окружающих их обертонов.
Гармоники — это максимумы в частотном спектре любого музыкального инструмента, наш голос — не исключение.
Гармоник в голосе обычно 5.
1ая гармоника — фундаментальная — так её ещё называют. Частота первой гармоники соответствует частоте ноты.
Например, я пою ноту Ля малой октавы — её частота 440Гц. Значит первый максимум в спектре будет именно в области 440Гц.
Дальше идёт вторая гармоника — умножаем на 2 частоту первой — 880Гц и так далее умножаем на 2:
3я гармоника — 1760Гц
4я гармоника — 3520Гц
5я гармоника — 7040Гц
Только что мы рассчитали расположение максимумов при звучащей ноте Ля 440Гц.
У женщин расположение гармоник сдвинуто выше, так как женский голос выше.
Гармоники вокала чаще называют формантами.
Для сведения микса эффективная область частот голоса — примерно от 900Гц до 8-9кГц
(после 8-9кГц человек перестаёт воспринимать звук как музыку)
Но речетатив у каждого по диапазону исполняемых нот не такой уж и большой — если проанализировать речетатив, то можно
увидеть что диапазон речетатива обычно не больше октавы. В вокале так же исполняемая мелодия обычно это 1.5-2октавы.
Именно это и даёт нам возможность находить зоны и делать их ещё ярче, а ненужные зоны тише. Так как мы уменьшили громкость нашей голосовой дорожки компрессором, мы имеем законное право повышать области частот
на эквалайзере (умеренно) и тогда пиков не будет.
Эквализация заключается в нахождении эффективных областей и их повышения или понижения громкости с помощью EQ. Включаем Waves PAZ Analyzer на последнюю ячейку обработки, и находим форманты:
1.Область 1400-3000Гц (для мужчин ниже, для женщин выше) — место третьей форманты — это область разборчивости речи. Неслучайно во всех современных телефонах диапазон частот динамика равен примерно 1000-4000Гц. Найдя на анализаторе нужную область 3ей форманты, повышаем её на 1-3dB на слух. Это раз.
2.Область певческой форманты. 4ая по счёту гармоника — это певческая форманта. Чем она выраженнее, тем лучше звучит вокал. Повышаем область певческой форманты на 1-3dB на слух. Это два.))
3.Область 5ой форманты — то же нужно искать и поднимать — от 5000Гц до 8-9000Гц. Иногда этого делать не нужно, но иногда эта область несёт в себе море красок. Поэтому стоит поэкспериментировать с этой областью.
4.Область 500Гц — даёт «эффект присутствия» её нужно повышать, если вы хотите усилить ощущение первого плана поднимайте эту область, но иногда этого делать не надо, а иногда даже стоит чуть-чуть убрать эту область в связи с особенностями голоса.
5.Область 100-400Гц — «басисто-бубнящая» так я её называю — по сути не должна выделяться, если только у вас не низкий голос, в случае с низким голосом чуть-чуть буквально на 0.5-1.5dB убираем эту область на эквалайзере.
6.Область 9000Гц-20 000 — это область шипящих букв Ж,Щ,Ш,С,З и высокочастотных обертонов лучше не трогать эту область
без надобности, от шипящих лучше избавляться Де-Эссером, если микро не очень, обычно повышение этой области улучшает
качество, однако не забывайте о том, что поднимая высокие, вы поднимаете шипящие и Де-Эссер не всегда помогает.
В заключении эквализации хочу сказать, что эквалайзер — вещь тонкая, нужно работать им аккуратно, и без слышимой надобности не поднимать и не опускать по громкости те или иные области, следить за значениями dB.
Есть ещё один замечательный прибор обработки, который меняет частотные составляющие сигнала в плюс. Он обогащает спектр звука как бы недостоющими составляющими, то есть, попросту говоря, украшает звук. Имя этому прибору — энхансер (Enhancer)
3. Пространственная обработка. Пространственная обработка заключается:
A) В создании единой стерео картины акапеллы
Б) Операции с панарамированием сигнала, созданием планов
В) Придание звуку своего пространства, зачастую единого с пространством сводимой с голосом фонограммы.
А теперь подробнее по пунктам:
А — Создание единой стерео картины акапеллы. Звук, снимаемый микрофоном — это моно-сигнал. Фонограмма же, с которой вы сводите акапеллу, обычно имеет широкую стереобазу. Но как получить из моно стерео?
Ну, во-первых, сразу нужно рассказать о таком понятии как псевдо-стерео. Именно псевдо-стерео может сделать из моно стерео. Как это делается: этот же сигнал, но с немного другими временными характеристиками подмешивается к основному, панарамируется в левый канал, затем опять тот же сигнал, но с немного другими временными характеристиками подмешивается в правый, в итоге мы имеем немного размазанное, но вполне стереозвучание. Waves Doubler выполняет эту функцию.
Можно сделать стерео, записав даблы (одинаковые дорожки голоса) и подмешать их в нужной пропорции, панарамируя один дабл в левый канал, а другой соответственно в правый. То же самое делается и с бэк-вокалом. Это стерео я называю R-L, так как осуществляется панарамированием в L и R каналы.
Но область стереобазы не ограничивается только Левым и правым каналами. Ещё есть глубина звука по оси спереди-сзади.
В итоге мы имеем пространство, где передний план будут занимать моно-звуки, обработанные одним образом, слева и справа
мы помещаем обьект путём панарамирования, а задний план достигается путём инвертирования фазы одного из двух одинаковых моно каналов. Слишком сложно? Короче, для того чтобы создать 3ий вид стерео — «перед-зад» нужно подмешать к прямому моно звуку дорожку, на которой будет стоять эффект PhaseInvertor. Стоит отметить что этот вид стерео позволяет поместить обьект посередине и просто придать ему эдакой стерео-мощи, используя всего 2 записанных дабла!
Стоит отметить, что в L-R-стерео нельзя поставить источник посередине с помощью только двух даблов, потому что один будет панарамирован чуть-чуть в одну сторону, другой — в другую, а посередине — пустота. В итоге получается немного нереальная стереокартина — поэтому я не советую использовать 2 дабла и микшировать их по панораме, лучше записать ещё
один 3ий дабл и поставить его посередине, либо использовать стерео «перед-зад» или псевдо-стерео. в случае с бэк-вокалом проблем обычно не выходит — 2 дорожки выставленные по системе L-R стерео хорошо вписываются в акапеллу.
Б) Операции с панарамированием сигнала — процентная величина панорамирования зависит от ширины стереобазы сводимой с голосом фонограммы. Ширину можно узнать следующим образом: на мастер ставится эффект Waves PAZ Analyzer и в окне анализатора внизу есть отдел, показывающий стереокартину. Там мы и увидим ширину. В соответствии с ней ставим % панарамирования на даблах и бэках, естественно одинаковый.
Если стереокартина фонограммы затрагивает «задние» области, то нам нужно добавить эти составляющие следующим образом:
на канал стерео ставится эффект Waves S-1 Imager, он раздвигает звук по стерео и прибавляет «задние» составляющие, только если вы собираетесь использовать этот эффект, вы должны знать что % панарамирования даблов/бэков не должен быть больше 50%. Оптимальное значение — 45%
Создание планов.
На самом деле про это надо было писать в самом начале, но и тут можно вникнуть))
В самом начале записи звукорежиссер выбирает систему, по которой он будет сводить голоса в единый стереообраз.
Он должен знать, какая дорожка на какой канал обработки отправится. С помощью каналов обработки мы и будем создавать
планы:
1ый план (например, канал №5) — основной, ближний план. Для него отдельный канал, отдельная обработка. На этом канале акапелла
должна звучать лучше всего, поэтому и с обработкой придётся покопаться, как это было описано выше в пунктах 1 и 2…
1ый план должен звучать громче остальных. Остальные каналы — это дополнительные планы, все они звучат тише.
2 план (например, канал №4) — стерео даблы или дабл.
2ой план создаётся по той же схеме обработки, только после основных эффектов может добавиться S-1 Imager, сюда
отправляются уже панарамированные даблы или может быть помещён только один дабл файл с эффектом PhaseInvertor. Канал 2ого плана примешивается к 1ому плану по громкости где-то в отношении 1/2 (50%/100%) Вообще этот план играет функцию «придавания стереозвучания» к основному плану.
3ий план (например канал №6) — это бэки. Они панарамируются, отправляются на этот канал, обработка такая же как и у канала 2ого плана, только громкость чуть больше — соотношение где-то 3/4 (75%/100%)
Желательно не обрабатывать на одном канале больше 2ух одновременно звучащих акапелл. Может добавиться ещё несколько планов — например дополнительный бэк-вокал или айр-бэки.
Создание планов Дальний-Ближний-Средний
Это немного отдельно от сведения голоса, однако то же пригодится.
Обьекту можно придать дальность. Делается это с помощью эквалайзера и ревербератора.
Ближний план характеризуется большим количеством низких и высоких частот, небольшим временем реверберации и её небольшой громкостью, с задержкой реверберационного хвоста примерно 30-40мс.
Дальний план — наполовину убрана область низких частот, ещё больше убрана область высоких. Реверберационный хвост длинный, без задержки, прямого звука около 80%
Средний план — это что-то среднее между дальним и ближним: басы почти не убираем, убираем чуток высоких, время реверберации обычное, прямой звук 100% без задержки хвоста.
4. Высота звука — самое простое. По крайней мере в записи речетатива проблем нет. Что касается вокала. Тут различные «криво спетые» моменты нам поможет выровнять программа Melodyne. нужно учитывать, что у фонограммы есть своя конкретная тональность и все ноты должны соответствовать звучанию нот тональности.
5. Временные характеристики. А вот здесь как раз и сложности с речетативом. Во-первых текст изначально должен быть прочитан и записан ровно по ритму. Во-вторых все бэки и даблы должны максимально точно совпадать по ритму с основной дорожкой. В противном случае кусочки плохослышных из-за основного голоса даблов и бэков можно выровнять, вырезая отдельные фрагменты и подставляя их под основную дорожку. Рисунок должен быть примерно одинаковым. Иногда некторые
фразы нужно растягивать или сжимать. Чем ровнее стоят все дорожки друг под другом, тем лучше и целостней звучит микс. Сначала нужно прослушивать основную дорожку голоса с музыкой и убедиться, что основная дорожка по ритму и темпу совпадает с темпом музыки во всех местах. Затем лучше отключить музыку, и выравнивать всё под ритм основной акапеллы. Так лучше слышно все нюансы.
Для достижения лучшего звучания акапеллы и минуса вместе, используется Delay, его темп должен соответствовать темпу минуса, но его не должно быть отчётливо слышно, однако если его убрать становится ясно, что он делает.
Сведение с минусом.
Лучше когда у звукорежиссёра есть мультитрек. Тогда он может с нуля сбалансировать по громкости и частотам весь микс.
Если же у вас просто минус, тоже не беда.
Несколько важных пунктов сведения акапеллы и минуса:
Основные частоты голоса — 3я и 4ая форманты — несут в себе большую часть информации об акапелле, поэтому если в минусе
имеются инструменты в том же диапазоне частот, они могут сбивать акапеллу, сколько бы ты не делал громче и не портил
баланс. Выход — чуть-чуть прибрать эквалайзером ту самую мешающую область частот в минусе, может и не одну а пару
узких областей.
Так же минус может быть изначально отмастеренным — то есть по всем своим характеристикам готовым к прослушиванию.
Обычно компрессия такого минуса не позволяет компрессировать дальше, а надо — ведь компрессия на мастере — это
финальный штрих в сведении и мастеринге. Именно компрессия всего вместе, пусть и не большая, заставляет акапеллу и минус звучать как единое целое, так как теперь и то и другое подвергается общим законам динамической обработки.
Так вот, если минус не пригоден к дальнейшему компрессингу, его надо «разкомпрессировать». Для этого и существует
специальная настройка компрессора — Expander, ratio<1, компрессор делает тише то, что когда то делалось громче. С помощью экспандера можно отменить старую компрессию и уже делать «пачку» из вашей красивой акапеллы и музыки.)))ыыы
Ну вот пожалуй это всё что я вспомнил сейчас)) Ещё раз обработка:
1. EQ
2. Comp Gate
3. De-Esser
4. Compressor
5. EQ
6. Enhancer/Maximizer/Limiter
7. Doubler или S1-Imager или Phaseinvertor (для стерео)
8. Delay
9. Reverb
10. PAZ Analyzer
Кое-какие понятия:
Сэмпл — звуковой фрагмент, отрезок волны.
0dB — в цифровых стандартах значение 0dB является пороговым, то есть максимальным, и всё что выше 0dB на экспорте
срезается клиппером, так же сигнал больше 0 dB может иметь нелинейные искажения (перегрузы).
Нормализация — процедура, увеличение громкости сэмпла на возможный максимум — приравнение самого громкого места сэмпла
к 0dB.
КОРОЧЕ ДОПОЛНЯЙТЕ ИСПРАВЛЯЙТЕ КОММЕНТИТЕ!)) тем кто понял чё к чему)
звук стал перекомпрессированный.
- 3 месяца назад
месяц назад, звучание сильно изменилось. я сначала подумал что проблема в смартфоне. но тоже самое происходит и в планшете.
звук стал перекомпрессированный. очень неприятно слушать.
кажется вы все песни пропустили через обработку. можно ли исправить?
Связаться с нами
-
Чат поддержки
-
Справка
Форумы других сервисов
-
Яндекс Плюс
-
Кинопоиск
-
Яндекс Афиша
-
Алиса, Станция и колонки
Следите за нами
Подтверждение
Smart Sound, музыка и звук Всё по звуку: поиск, установка и решение проблем…
![]() |
|
Отзывов: (0) Сообщений: 31 Благодарностей: 31 Регистрация: 13.11.2005 Страна:
|
14.06.2010, 01:17 подскажите как лучше обработать сильный перегруз по звуку, случайно было выставлено ручное управление. |
|
|
Основатель форума Отзывов: (502)
Сообщений: 10,314 Благодарностей: 55750 Регистрация: 07.11.2005 Адрес: Питер
|
14.06.2010, 01:31 Ой боюсь что никак. [Для просмотра данной ссылки нужно ]
|
|
|
Отзывов: (2)
Сообщений: 908 Благодарностей: 7317 Регистрация: 09.05.2009 Страна:
|
14.06.2010, 03:11 ну, идеального звука не добиться, конечно, но декомпресиия и нормализация к -0.2 Дб исправят кошмар в колонках… Во время всеобщей лжи говорить правду — это экстремизм. (с) Дж. Оруэлл. [Для просмотра данной ссылки нужно ] |
|
|
EXTREME USER Отзывов: (0) Сообщений: 338 Благодарностей: 489 Регистрация: 08.12.2007 Адрес: Бийск-Белокуриха
|
14.06.2010, 06:21 Anachoret, Это если сигнал имеет нулевое значение, то так и есть. Хотя сильно картина не изменится. |
|
|
Отзывов: (0)
Сообщений: 23 Благодарностей: 25 Регистрация: 06.08.2006 Адрес: 23 rus
|
19.06.2010, 20:15 Для тех, кто работает в Вегасе, есть плагин — |
|
|
Отзывов: (0) Сообщений: 12 Благодарностей: 3 Регистрация: 13.03.2008 Адрес: Харков
|
15.07.2010, 00:11 Столкнулся с аналогичной проблемой на камере кенон А1 во время замены кассеты задел маленький рычажок, и незаметил, в результате сильный перегруз по звуку! Подскажите название фильтра или плагина в програме adobe audition как это хотябы частично исправить! |
|
|
Отзывов: (8)
Сообщений: 6,907 Благодарностей: 11846 Регистрация: 08.11.2005 Страна:
|
15.07.2010, 08:11 «Clip Restoration» |
|
|
Виконтесса NLE Отзывов: (6)
Сообщений: 1,958 Благодарностей: 12087 Регистрация: 25.03.2006 Адрес: Москва
|
22.09.2010, 23:54 Бронекрылок, так тут уже Тимур Белок и Маклауд все написали. Можете тут еще почитать: Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)): У вас нет прав чтобы видеть скрытый текст, содержащейся здесь. С уважением Tigris. [Для просмотра данной ссылки нужно ] |
|
|
Отзывов: (0) Сообщений: 3 Благодарностей: 0 Регистрация: 04.05.2010 Страна:
|
27.09.2010, 14:04 подскажите пожулайста, вот такая проблема при съемки в загсе неопытный музыкант за пультом ставил музыку невыносимо громко теперь на съемки звук репит. можно ли как нибуть это исправить. и вообще кто знает как на камере DVX100ВЕ бороться со звуком устаешь за всёсвадьбу настраивать звук то громче то тише и неугодаешь где как. заранее спасибо переехали в соответствующую тему
Последний раз редактировалось Tigris; 11.10.2010 в 10:40. Причина: не в том разделе
|
|
|
Виконтесса NLE Отзывов: (6)
Сообщений: 1,958 Благодарностей: 12087 Регистрация: 25.03.2006 Адрес: Москва
|
27.09.2010, 14:27 [Для просмотра данной ссылки нужно ]
, небольшой пример выложите в mp3 файле сюда. С уважением Tigris. [Для просмотра данной ссылки нужно ] |
|
Часто задаваемые вопросы по динамической обработке аудио сигнала
11 марта 2011 | Максим Иванов
Что такое динамический диапазон?
Динамический диапазон можно определить как расстояние между уровнями самого тихого и самого громкого сигналов из возможных. К примеру, если в инструкции к процессору указано, что максимальный входной уровень сигнала до искажения равен +24 дБ, а шумовой порог на выходе равен -92 дБ, значит суммарный динамический диапазон процессора равен 24 + 92 = 116 дБ.
Динамический диапазон оркестра в среднем находится в пределах от -50 дБ до +10 дБ. Что в сумме даёт 60 дБ. Хотя вам может показаться, что динамический диапазон в 60 дБ — это мало, проведя простые расчёты, оказывается, что +10 дБ — это в 1000 раз громче, чем -50 дБ!
Динамический диапазон в рок музыке намного меньше, обычно от -10 dдБ до +10 Дб, или 20 дБ в сумме. Поэтому смешивание разных сигналов в рок музыке в единый микс довольно занудное занятие.
Для чего нам компрессия?
Допустим, вы работаете над сведением роковой записи, средний динамический диапазон у нее 20 дБ. И вы хотите добавить в микс необработанный компрессором вокал. Средний динамический диапазон у вокала равен примерно 40 дБ. Чем это чревато для микса? Слишком тихие вокальные куски будут просто не слышны, а слишком громкие будут выпирать из общей картины. В данной ситуации компрессор необходим для уменьшения (компрессии) динамического диапазона вокала в пределах 10 дБ.
В данном случае вокал будет находиться примерно на уровне +5 дБ. Диапазон — от 0 дБ до +10 дБ. Тихие фразы теперь будут выше самого низкого уровня сигнала в миксе, а громкие фразы не будут выпирать. Получается, что вокал занимает своё место в миксе.
Тот же самый принцип работает для любого инструмента в миксе. У каждого инструмента есть свое место в миксе, а хороший компрессор помогает звукорежиссеру правильно их смешать.
Разве компрессор нужен для всего?
Обычно в ответ на этот вопрос вы слышите: «Конечно же, нет! Перекомпрессированные треки звучат ужасно.” Это утверждение верно лишь в одном случае — если вы отчетливо слышите как работает компрессор на записи. Качественный дорогой компрессор, будучи правильно настроенным, звучит незаметно! Перекомпрессированный звук — это следствие ошибок в обработке конкретных инструментов, если конечно это не сделано умышленно с целью получить спецэффект.
Как вы думаете, зачем на всех дорогих микшерных пультах на каждом канале есть свой компрессор? Ответ прост — большинство инструментов нуждается в компрессии, пусть даже едва заметной. Это помогает им быть слышимыми в миксе.
Зачем нам нойз-гейты?
Давайте рассмотрим пример с вокалом. Допустим, вы установили для него диапазон в 20 дБ. Проблемы начинаются, когда компрессор усиливает самые тихие сигналы в вокальном треке. Всплывают всякие нежелательные шумы на заднем плане, куски фонограммы, попавшей в микрофон из наушников и т.п. Вы можете попробовать просто убрать громкость в паузах, но это обычно заканчивается полным провалом. Намного лучший способ — использовать нойз-гейт. Мы можем установить порог срабатывания нойз-гейта, к примеру, на -10 дБ, что соответствует нижней границе динамического диапазона вокала в нашем случае. Таким образом гейт будет автоматически убирать в ноль все нежелательные сигналы между фразами.
Если вы когда-либо пробовали сводить живую запись, вы знаете сколько проблем возникает с ударной установкой, а именно с железом, которое проникает в микрофоны, установленные на томах. Как только вы добавляете верхов на эквалайзере, чтобы сделать томы более яркими, начинают лезть наверх тарелки. И это особенно хорошо слышно через ВЧ громкоговорители в мониторах. Если же мы используем гейты на микрофонах, записывающих томы, так что железо больше не будет звучать через них в паузах, мы очень сильно прочистим общий микс и сделаем его в разы разборчивее.
Типы динамической обработки
Динамическая обработка — это процесс изменения динамического диапазона сигнала, позволяющий расширить возможности оборудования, через которое записывается или воспроизводится этот сигнал. Иными словами, мы получаем возможность записывать или проигрывать записанный сигнал без искажений и/или шума, тем самым упрощая себе задачу сведения.
Компрессор и лимитер
Пробивной, хорошо слышимый, с хорошим презенсом — это все описания звуковых сигналов, полученных при помощи их обработки компрессорами и лимитерами.
Компрессия и лимитирование — это формы управления динамическим диапазоном (громкостью) сигнала. Аудио сигналы имеют довольно большой разброс по уровням громкости. Пиковый сигнал может вызвать перегрузку в звукозаписывающей цепи, что в свою очередь вызовет искажение сигнала.
Компрессор/лимитер — это своего рода усилитель, в котором уровень громкости зависит от уровня проходящего через него аудиосигнала. Выбрав определённое значение компрессора/лимитера, сигнал будет автоматически ослабляться выше заданного уровня или порогового уровня.
В сущности, компрессия – это процесс ослабления входного сигнала в заданной пропорции. Используется для сужения динамического диапазона голоса или музыкального инструмента, позволяет производить запись без искажений. Также применяется при создании микса, уменьшая разницу частот каждой дорожки.
Вокалист, допустим, постоянно перемещается перед микрофоном и сигнал на выходе колеблется вверх-вниз, что звучит странно. В данном случае компрессор решит проблему, ослабив громкость отдельных фраз так, что в результате будет ровный вокал.
Степень ослабления сигнала зависит от соотношения компрессии и порогового уровня. Соотношение 2:1 или меньше считается слабой компрессией, при которой сигнал на выходе, превышающий пороговый уровень, уменьшается в два раза. Соотношения выше 10:1 можно называть сильным лимитированием.
Чем ниже пороговый уровень, тем большая часть сигнала подвергается компрессии (при определённом уровне входного сигнала). Важно знать меру, так как слишком сильная компрессия убивает динамику записи (при этом некоторые звукорежиссёры убивают её специально в качестве эффекта)!
Лимитирование – вид обработки сигнала, при котором подавляются всплески громкости (скачки амплитуды).
Компрессор/лимитер используется при выполнении многих задач при обработке звука, например:
Звук бочки ударной установки может затеряться среди электрогитар. И не важно, как громко звучит дорожка, бочка звучит “грязно”. Компрессия выправит звук бочки на фоне гитар.
Диапазон голоса на записи достаточно широк. Пики громкости могут сильно выпирать из общего звучания. Таких пиков может быть много, и они все разные, так что почти невозможно их выровнять через микшер. Компрессор/лимитер автоматически контролирует громкость, не искажая тонкостей вокала.
Соло гитара глушится ритмом. Не выкручивайте фейдер до предела, компрессия поставит ведущую гитару на своё место в миксе.
Бас-гитару сложно записывать. Ровный звук с хорошей атакой достигается за счёт правильной компрессии. И не нужно обрезать низы микса — компрессор/лимитер позволит басу проявиться на любых частота
Экспандер
Существует два основных вида экспансии: динамическая и нисходящая. Экспансия расширяет динамический диапазон сигнала, когда он выше порогового значения. Динамическая экспансия – это, по сути, компрессия наоборот.Динамическая экспансия применяется на ТВ и радио, чтобы отменить компрессию непосредственно до передачи аудио сигнала. Компрессию с последующей экспансией называют компандированием.На данный момент чаще всего применяют нисходящую экспансию. В отличие от компрессии, которая понижает сигнал выше порогового значения, экспансия понижает сигнал ниже порога экспансии. Степень понижения определяется соотношением экспансии. Например, соотношение 2:1 понижает сигнал вдвое (это значит, что если сигнал ниже порогового значения на 5дБ, экспандер понизит его до 10дБ).Экспансию часто используют для уменьшения шумов, это очень мощный и простой нойз-гейт. Главное различие между экспандером и нойз-гейтом в том, что экспансия зависит от того, насколько сильно сигнал ушёл “под порог”, тогда как при работе нойз-гейта это не имеет значения.
Шумоподавление
Шумоподавление – процесс устранения нежелательного шума из записи посредством ограничения сигнала ниже заданного порогового значения. Как было написано выше, работа нойз-гейта не зависит от уровня сигнала ниже порога. Выход устройства открыт, пока сигнал находится выше порога.
Длительность открытия выхода определяется скоростью атаки. Длительность работы устройства, когда сигнал ниже порогового называется временем удержания. Скорость закрывания выхода определяется временем возврата. Уровень подавления нежелательного сигнала в закрытом положении определяется диапазоном.
Краткий словарь терминов
Научно доказано, что если вы хотите быстро изучить какой-то предмет, вы должны для начала разобраться с основными понятиями. Тот же принцип действует и в звукозаписи и в дальнейшей работе со звуком. Большинство инструкций и учебников предполагают наличие базовых знаний, без которых читать их затруднительно. Надеюсь, что следующий раздел поможет вам навести порядок в голове и окончательно разобраться с основами.
Компрессоры
Атака (Attack).
Атака определяет скорость действия компрессора на входной сигнал. Долгая атака (регулятор по часовой стрелке до упора) вначале позволяет сигналу (т.н. начальный переходный процесс) проходить необработанным через компрессор, тогда как короткая атака (против часовой стрелки до упора) сразу же обрабатывает сигнал согласно соотношению компрессии и установленному пороговому уровню.
Авто (Auto).
Компрессор работает в режиме автоматической атаки и возврата. Регуляторы в этом случае не влияют на процесс, а используются запрограммированные значения параметров.
Боковой канал компрессора (Compressor Sidechain).
Вход бокового канала прерывает сигнал, с помощью которого компрессор определяет необходимой уровень компрессии. При отключенном боковом канале, входной сигнал идёт сразу на главную схему компрессора. При его включении, сигнал на главную схему не поступает. Теперь можно обрабатывать управляющий сигнал эквалайзером, например, применив де-эссинг (частотная коррекция голоса). После обработки управляющий сигнал поступает обратно в компрессор через выход канала. Типичное применение бокового канала – использование компрессора для приглушения фоновой музыки во время выступления ведущего или снижения громкости ритм-гитары на фоне вокала. Теперь голос легко различим. В этом случае голосовая дорожка идёт в боковой канал, в то время как фоновая музыка — на основную схему компрессора. Теперь компрессор понижает уровень фоновой музыки (процесс называется дакинг), когда вокалист начинает петь или говорить.
Жёсткая и мягкая компрессия (Hard/Soft Knee)
При жёсткой компрессии ослабление сигнала происходит максимально быстро в момент превышения пороговой величины. При мягкой, сигнал ослабляется более плавно, после того, как он превысил заданный порог, что обеспечивает более естественное для музыки звучание.
Лимитеры.
Лимитер – это компрессор, не допускающий увеличения сигнала выше уровня порога. Например, если порог установить на 0 дБ, параметр “Ratio” выкрутить полностью по часовой стрелке, то компрессор начнёт работу в режиме лимитера при 0 дБ, и выходной сигнал никогда не превысит этого значения.
Компенсирующее усиление (Makeup Gain).
При компрессии, сжатие сигнала обычно влияет на общий уровень громкости. Регулятор усиления позволяет восстановить утерянный при компрессии уровень.
Соотношение (Ratio).
Соотношение – это зависимость между выходным и входным сигналами, этот параметр устанавливает крутизну компрессии. Например, установив соотношение 2:1, любой сигнал выше порогового подвергнется компрессии в соотношении 2:1. На каждый децибел на входе компрессора приходится 0.5 дБ на выходе, таким образом образуется компрессия, сжимающая сигнал в два раза. При увеличении соотношения, компрессор постепенно переходит в режим работы лимитера.
Время возврата (Release).
Время возврата — это время, которое проходит между тем, как уровень входного сигнала упал ниже порога, и моментом, когда уровень компрессии вернулся на нулевой (компрессор перестал ослаблять сигнал). Короткий возврат создаёт неровный, “рубленый” звук, особенно у бас-гитары. Долгий возврат слишком “пережимает” звук, расплющивая его. Любому значению времени возврата найдётся применение – подбирайте на слух.
Threshold.
Пороговый уровень компрессии (порог компрессии) определяет значение, выше которого начинается ослабление сигнала. Обычно поворот регулятора порога влево увеличивает сигнал, который подвергается компрессии (при соотношении выше, чем 1:1).
Экспандеры
Нисходящая экспансия (Downward Expansion).
Нисходящая экспансия чаще всего применяется в профессиональной звукозаписи. Сигнал ослабляется ниже порогового значения. Это стандартный способ подавления шумов.
Соотношение (Ratio).
Соотношение экспансии определяет уровень ослабления сигнала, когда он опустился ниже порога. К примеру, при соотношении экспансии 2:1 каждый децибел ниже порогового значения ослабляется в два раза. При соотношении 4:1 и выше экспандер работает почти как нойз-гейт, только без возможности регулирования времени атаки, задержки и возврата.
Нойз гейты (Noise Gate)
Атака (Attack).
Параметр «время атаки» устанавливает величину, при которой открывается гейт. Быстрая атака подходит для перкуссивных инструментов, в то время как вокал и бас-гитара требуют плавного открытия. Применение к ним слишком быстрой атаки приведёт к появлению ощутимого “шёлкания” при сведении. Щелчок при открытии присущ любому гейту, но при правильной настройке его не слышно.
Время удержания (Hold).
Время удержания – фиксированный период времени, при котором гейт находится в открытом состоянии при уровне сигнала ниже порогового. Значение этого параметра играет роль при гейтировании, например, малого барабана – после удара по нему проходит определённое время, после которого гейт резко закрывается.
Диапазон (Range).
Диапазон гейта – величина ослабления сигнала, когда гейт закрыт. Таким образом, при значении этого параметра 0 дБ ослабления сигнала вообще не происходит. Значение -60 дБ означает, что при закрытом гейте сигнал будет ослаблен (гейтирован) на 60 дБ и т.д.
Время возврата (Release).
Время возврата гейта определяет скорость, с которой гейт переходит из открытого в полностью закрытое состояние. Время возврата обычно настраивают так, чтобы сохранить естественное затухание звука инструмента или вокала. Высокая скорость возврата убирает шумы, но может вызвать “заикание” ударных инструментов, которое устраняется низкой скоростью возврата. Внимательно настраивайте этот параметр для наиболее естественного эффекта.
Пороговый уровень (Threshold).
Пороговый уровень гейта устанавливает значение, при котором гейт открывается. Принцип прост — любой сигнал выше порогового проходит нетронутым, а сигнал ниже ослабляется на величину, зависящую от настроек диапазона. Если выкрутить регулятор влево до упора — гейт будет отключен (т.е. всегда открыт), и любой сигнал проходит без ослабления.
Общие рекомендации по компрессии аудио сигнала
Ниже приведены пресеты компрессии, используемые в PreSonus BlueMax. Данные пресеты – стандартные установки, своего рода отправные точки для работы со звуком.
Вокал
Тёплый вокал. Это параметры для лёгкой компрессии с низким соотношением и расширенным диапазоном, в основном для лирических песен в живом исполнении. Вокал “на своём месте”.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -8.2 дБ | 1.8:1 | 0.002 ms | 38 ms |
Средний. Более жёсткие параметры, динамический диапазон уже. Партия голоса выступает из микса.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -3.3 dB | 2.8:1 | 0.002 мс | 38 мс |
Кричащий. Параметры для громкого вокала. Довольно жёсткая компрессия для вокалистов, которые не следят за расстоянием до микрофона. Голос сильно выступает из микса, создавая эффект присутствия.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -1.1 дБ | 3.8:1 | 0.002 мс | 38 мс |
Перкуссия
Малый барабан/бас-барабан. Данный пресет пропускает пики и сжимает остальную часть сигнала, при этом слышим чёткий звук с затуханием.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -2.1 дБ | 3.5:1 | 78 мс | 300 мс |
Левый/правый (стерео) оверхэды. Параметры «соотношение» и «порог» здесь низкие, что даёт широкий диапазон, в который помещаются даже тарелки. Глубокие низы, общее звучание живое с невысокой реверберацией. Более пробивной звук, меньше эффекта комнаты.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -13.7 дБ | 1.3:1 | 27 мс | 128 мс |
Струнные инструменты
Бас-гитара. Быстрая атака и медленный возврат пресета “сожмут” бас так, чтобы он хорошо сидел в миксе.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -4.4 dB | 2.6:1 | 45.7 мс | 189 мс |
Акустическая гитара. Пресет подчёркивает атаку акустической гитары и обеспечивает ровность звучания, что позволят гитаре оставаться слышимой.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -6.3 дБ | 3.4:1 | 188 мс | 400 мс |
Электрогитара. Настройки для плотного ритма. Небольшое время атаки придаёт ритм-партии напор и живость
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -0.1 дБ | 2.4:1 | 26 мс | 193 мс |
Клавишные инструменты
Фортепиано. Особый пресет для выравнивания всего диапазона фортепиано – от нижнего звука до пятой октавы. Чётко слышны партии обеих рук.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -10.8 дБ | 1.9:1 | 108 мс | 112 мс |
Синтезатор. Быстрая атака и возврат подходят как для духовых, так и басовых партий на синтезаторе.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -11.9 дБ | 1.8:1 | 0.002 мс | 85 мс |
Оркестр. Настройки подходят как для струнных, так и других оркестровых “наборов” синтезатора. Общий динамический диапазон снижен для удобного добавления в микс.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| 3.3 дБ | 2.5:1 | 1.8 мс | 50 мс |
Стерео микс
Стерео лимитер. Исходя из названия, у этого пресета жёсткое лимитирование, что делает его идеальным для сведения двух дорожек или двух моно-каналов в один стерео.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| 5.5 дБ | 7.1:1 | 0.001 мс | 98 мс |
Контур. Настройки расширяют диапазон основного микса.
| Threshold (порог) | Ratio (соотношение) | Attack (атака) | Release (возврат) |
|---|---|---|---|
| -13.4 дБ | 1.2:1 | 0.002 мс | 182 мс |
Война за громкость: к проблеме современной тенденции перекомпрессии фонограмм.
Данная статья посвящена явлению, в котором видят причину ухудшения слуха у молодежи, ухудшении качества звучания фонограмм и, наконец, в падении продаж в музыкальной индустрии. Говоря «перекомпрессия», мы имеем в виду не компрессию данных в форматах аудио, а компрессию динамического диапазона, в данном случае – чрезмерную компрессию. «Википедия» дает следующее определение: «Война громкости (гонка громкости, война за громкость) – склонность музыкальной индустрии к постепенному увеличению громкости записываемой и распространяемой музыки в стремлении выделить свои записи на фоне остальных». Но только ли это?..
Немного теории
Не секрет, что звукорежиссер, используя современные средства обработки, имеет много возможностей заставить свою фонограмму звучать громче фонограммы конкурентов. Более того, как правило, звукорежиссер старается сделать фонограмму громче. Зачем? На то есть несколько причин. Первая причина кроется в нелинейности восприятия человеческого слуха. В силу действия кривых равной громкости, человеческое ухо на тихих уровнях менее чувствительно к низким и высоким частотам, поэтому музыка воспринимается как менее энергичная, менее прозрачная и более приглушенная. Однако, с увеличением громкости восприятие становится более линейным, и человеку кажется, что низких (бас) и высоких (сибилянты, тарелки и т. д.) частот в фонограмме все больше и больше, а соответственно, звучание становится более «басовитым», «упругим», энергичным, ярким, разборчивым.
Во-вторых, отчасти обвиняют психоакустический эффект маскировки. Например, разговор на автобусной остановке совершенно невозможен, если подъезжает шумный автобус. Говорят, что музыка попросту будет заглушаться, и ее не будет слышно, если слушать ее в шумном месте. Причем, как известно, музыка не статична и имеет как громкие, так и тихие места, и получается, что страдают преимущественно тихие участки.
Соответственно, выход напрашивается сам собой: сделать тихие и средние по громкости участки громче, а громкие не трогать или, как говорят звукорежиссеры, применить динамическую обработку, в данном случае сжать динамический диапазон при помощи компрессии.
Однако после такой обработки фонограмма будет звучать громче в целом. Это связано с темрадио, что человек воспринимает громкость не по пиковым значениям, а по средне-квадратичным (RMS, «средняя громкость») и, несмотря на то, что пиковые значения остались на прежнем месте, возросла «средняя громкость», и фонограмма нам кажется более громкой. При оценке динамического диапазона также используют понятие кросс-фактора, т. е. разности между пиковым значением и среднеквадратичным. Чем выше кросс-фактор, тем выше динамический диапазон произведения.
Все бы хорошо, но динамика – это важнейшая составляющая музыкального произведения. Музыка «дышит» благодаря динамике, и получается, что те динамические оттенки, которые музыканты вложили в произведение, попросту удаляются при чрезмерной компрессии (перекомпрессии).
Звукорежиссеры различают макродинамику и микродинамику, где макро – это разность громкости между частями произведения, а микро – это пульс музыки, единичные всплески. Чрезмерное использование компрессии удаляет как макро-, так и микродинамику. Сравним графики фонограмм с яроко выраженной макро- и микродинамикой – с графиком фонограммы, где музыка стала жертвой «войны за громкость» (такие фонограммы звукорежиссеры называют «горячими» – hot).
Немного истории
В 70х годах было замечено, что те произведения, которые звучали по радио громче остальных, нравились слушателям больше, а соответственно, аудионосители с этими произведениями лучше продавались. Так появился еще один способ увеличения продаж. В 1979 году термин «война громкости» использовал Роберт Орбан в статье, посвященной чрезмерной динамической обработке, применяемой на радио. В работе говорилось о том, как радиостанции в погоне за рейтингами нарушали все мыслимые и немыслимые границы, применяя чрезмерное компрессирование и лимитирование фонограмм. Но это на радио. На «виниле» же развернуться войне громкости мешали несколько факторов: во-первых, технические ограничения носителя – чрезмерный уровень мог заставить иглу «выпрыгнуть» из канавки. Во-вторых, большая громкость предполагала меньшую продолжительность звучания на носителе, в чем никто не был заинтересован. Ну и, наконец, виниловые диски не так часто прослушивались в шумных местах, а ни о каком портативном воспроизведении и речи быть не могло. Однако с изобретением CD ситуация стала меняться: все ограничения были сняты, а относительно портативные проигрыватели быстро стали пользоваться популярностью. На приводимом графике, полученном на основе анализа 4500 самых популярных фонограмм, показан рост «средней громкости» в период с 1969 по 2010 года; при этом до начала массового производства компакт-дисков в 1982 году можно видеть определенную стабильность «средней громкости».
Проблемы
«Войну громкости» обвиняют в порче музыки, в падении продаж, в причине потери слуха у большого числа молодых людей, в утомляемости при длительном прослушивании музыки.
Так ли это?
Как уже было сказано выше, использованием чрезмерной компрессии звукорежиссер лишает произведения как макро-, так и микродинамики. Кроме того, такая обработка вносит огромный процент нелинейных искажений, так как происходит клиппирование сигнала. Получается, что фонограмма звучит не только монотонно, однообразно, но и «грязно», непрозрачно. Звукорежиссер Боб Спир: «Музыка, которую мы слушаем последнее время – это не больше, чем сплошные ритмичные искажения!». Выходит, что произведение страдает, прежде всего, с художественной стороны, и особенно это слышно на записях акустических инструментов. На рисунках ниже изображено одно и то же произведение, но разных лет издания – 1982 и 2008. Версия 2008 года – это ремастеринг, который звучит в два раза громче, но менее музыкально.
Было замечено, что огромная часть слушателей устанавливает громкость, ориентируясь на пиковые значения, доводя их до комфортного предела, однако звуковое давление (SPL) напрямую зависит от «средней громкости», и, соответственно, при прослушивании компрессированной музыки звуковое давление выше, чем при прослушивании не компрессированной. Кроме того, при воспроизведении, например, танцевальной электронной музыки басовая область звучит громко, но не энергично (так как почти отсутствует микродинамика), и обычный слушатель пытается это компенсировать увеличением громкости, доводя ее порой до немыслимых пределов. Как результат – проблемы со слухом у большого количества молодых людей. По результатам исследования, опубликованных в «Journal of the American Medical Association», в период с 1994 по 2005 год количество молодых людей, имеющих проблемы со слухом, увеличилось на 30 %. И цифры катастрофически растут.
Интересно, что первый MP3-плеер попал в массы в 1996 году, и с его изобретением изменились условия прослушивания музыки – ее стало возможным слушать везде. Такие устройства чаще всего оснащены низкокачественными наушниками-вкладышами и нередко вносят искажения во время воспроизведения, особенно на пиковых значениях сигнала. Кроме того, формат MP3 – это формат сжатия с потерями (lossy), т. е. компромиссный, заведомо ущербный формат более низкого качества воспроизведения. Данный формат подходит больше для прослушивания музыки в ознакомительных целях, поэтому он так осуждаем аудиофилами и просто искушенными слушателями. Так появилась «горючая смесь»: формат MP3 + «война за громкость» + портативный MP3-проигрыватель. Известные производители высококачественного аудио-оборудования выражают беспокойство о будущем аудио-индустрии. По их мнению, на данный момент подрастает целое поколение людей, которые не ценят качественное воспроизведение музыки. В последнее время для продажи музыки все чаще используют музыкальные интернет-магазины (например, iTunes, Amazon), где можно оставить свой отзыв о приобретенном альбоме. Огромное количество слушателей выражают недовольство по поводу того, что музыка стала «утомительной для прослушивания». Часто потребители жалуются на то, что ее невозможно слушать длительное время. В статье Эрла Викерса, посвященной «войне громкости», проводится аналогия перекомпрессированной музыки с печатным текстом, где все буквы – заглавные (отсутствует микродинамика) и нет деления на абзацы (отсутствует макродинамика). Такой текст большинству людей читать довольно сложно.
В результате описанных тенденций наблюдается – падение продаж музыки в аудиоиндустрии. Конечно, доказать взаимосвязь перекомпрессии и падения продаж нелегко. Исследований, проведенных в этом направлении, почти нет. Большинство людей в падении продаж склонно винить (впрочем, обоснованно) интернет-пиратство. Упомянем в этой связи работу Криса Джонсона, в которой проанализированы популярные альбомы последних десятилетий: автор приходит к выводу, что альбомы с большим динамическим диапазоном имели больший коммерческий успех. По данным RIAA (Recording Industry Association of America), одним из наиболее успешных альбомов всех времен является альбом группы «The Eagles» «Greatest Hits 1971–1975» , и он имеет чрезвычайно высокий динамический диапазон.
Не секрет, что есть категория людей, которые ценят хорошее звучание, вкладывают деньги в высококачественное Hi-Fi, Hi-End оборудование и готовы также приобретать соответствующие аудионосители, но из-за разбушевавшейся «войны громкости» они удовлетворяющей их запросам музыки в продаже не находят. Многие из них и не подозревают о «войне громкости», но то, что музыка стала звучать хуже, согласятся все. Здесь вспоминается интересная статья с говорящим названием «Смерть Hi-Fi: в эпоху MP3 музыка стала звучать хуже, чем когда-либо». И есть огромное количество людей – «жертв MP3». Они совершенно не требовательны к качеству звучания, их устраивает перекомпрессированная музыка в низкокачественном формате MP3, размещенная бесплатно в интернет-сетях, зачастую на сайтах самих исполнителей в демонстрационных целях. Так о каких продажах может идти речь?!
Решение проблемы
Какие же существуют варианты решения проблемы на данный момент? Необходимо разработать решение для потребителей (слушателей) и для производителей (музыкантов, звукорежиссеров, продюсеров и т. д.).
Потребителям необходимо иметь возможность слушать музыку с разной «средней громкостью» без постоянного обращения к регулятору уровня. Проще говоря, например, слушать «горячий» перекомпрессированный трек после некомпрессированного. Решением для потребителей является использование устройств, оснащенных алгоритмом громкостной нормализации (loudness normalization). Громкостную нормализацию не стоит путать с пиковой нормализацией, которая абсолютно бесполезна для этих задач. Громкость – это субъективный параметр, который зависит не только от RMS, но и от спектрально-временного состава. Соответственно, должен быть психоакустический алгоритм, который выравнивал бы по громкости произведения, записанные в разные годы с разным RMS, крест-фактором, спектром и т. д. Такие алгоритмы существуют. Например, в программной среде это реализовано в подключаемом модуле ReplayGain и в аудиопроигрывателе от компании Apple iTunes (опция SoundCheck). Данные программы в момент загрузки сканируют файл методом психоакустического анализа и уменьшают громкость фонограммы на необходимую величину. В результате фонограмма, которая звучала в 10 раз тише предыдущей, звучит с той же громкостью. ReplayGain использует эталонный уровень 89 дБ SPL (Target level) и RMS -14 дБ FS. Для радиовещания компанией Dolby разработан алгоритм Dialnorm, который преследует те же самые задачи, используя при этом RMS -31 дБ FS.
Что касается производителей, то аудиоиндустрия давно нуждается в стандартах. Когда-то компания Dolby разработала звуковой стандарт для кинематографа, и «война громкости» его обошла стороной. Почему бы то же самое не сделать для аудиоиндустрии?! Как отправную точку при разработке стандартов можно использовать рекомендации немецкого звукорежиссера мастеринга Фридмана Тишмаера (таблица ниже) или рекомендации американского звукорежиссера Боба Катца, опубликованные в его работе «Мастеринг аудио: наука и искусство»:
Jazz: не более – 16 dBFSRMS
Classical: неболее – 18 dBFS RMS
Rock/Hardrock/Metal/Punk: неболее – 10 dBFS RMS
Techno/trance/Hard Electro: неболее – 10 dBFS RMS
Pop/RnB/Hiphop/Broadcast: неболее – 12 dBFS RMS
Кроме принудительных методов решения можно использовать и поощрительные. Например, можно проводить конкурсы звукорежиссеров сведения и мастеринга, где важным пунктом была бы оценка динамического диапазона фонограммы. Также для целевой аудитории, которая ценит качественно звучащую музыку, можно выпускать специальные издания, помеченные особым логотипом широкого динамического диапазона и высокого разрешения (знаком качества).
Заключение
Война громкости – это порочный круг. Один известный продюсер в своем интервью как-то сказал, что все звукорежиссеры прекрасно понимают: перекомпрессия – это плохо, она разрушает фонограмму. Но все точно так же считают, что без ее применения фонограмма окажется неконкурентоспособной и звукорежиссер может лишиться работы. Убеждение, что более громкая музыка продается лучше, стало причиной серьезнейшей проблемы, которую нужно решать. В конце концов, как сказал Эрл Викерс: «Если бы при оценке мастерства громкость была определяющим фактором, то Вагнер считался бы самым величайшим композитором, превзойдя Моцарта, Баха, Бетховена вместе взятых. А в свою очередь Вагнеру было бы далеко до творчества современного реактивного самолета!»













