Майк торнтон реставрация и очистка звуковых файлов. Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки от пользователя. Редактирование информации в mp3-тэге

Майк торнтон реставрация и очистка звуковых файлов. Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки от пользователя. Редактирование информации в mp3-тэге
Вступление...

Специальная редакция для Обсерватории

Цикл статей по реставрации звука на обычном домашнем компьютере начат мной еще в 1999 году, но тихо почил, хотя и звуковых примеров и подготовленных анимированных gif-иллюстраций было набрано порядком. Любопытно, что мои материалы на эту тему погибали и восстанавливались несколько раз. Может, оно и к лучшему - на многое я сегодня смотрю по-другому, но и, как ни странно, остались кое-какие приемы и - что самое интересное - "софт", которые пережили эту почти семилетнюю разницу (а это огромный скачок в производительности домашних PC и качестве программ). На таких моментах я буду останавливаться подробней. В этом цикле я постараюсь охватить и общий подход к цифровой реставрации (в том виде, в котором я его отработал лично для себя, нисколько не претендуя на глобальность), и "задеть" необходимые места из теории звука и практики звукозаписи (как очень близкой области), и описать программы, которые мне кажутся наиболее удобными, и... однако, к делу.

Просто удручающее качество звуковых дорожек в большинстве из самопально оцифрованных советских мульт- и фильмов при довольно сносном качестве видео (про пираЦ кие сборнички музыки просто стыдливо умолчим) убеждают меня в необходимости такого начала. Более того, даже кое-какие эээ... студийные, так сказать, работы, а также диалоги с людьми, считающими себя в этой области профи, в духе:

А ты в курсе, что у тебя полезный сигнал заканчивается на 3КГц?

Да некогда мне было возиться со всеми этими компрессорами...

Я эти 11КГц преобразую в 44КГц и со звуком все нормально! Знаешь такой редактор CoolEdit?", - наводят на мысль, что даже самые примитивные базовые понятия порой следует внедрять под дулом автомата.

Кто считает, что ему это не нужно, может сразу перейти к третьей части - но, вдруг, и в первых двух найдет для себя новое, или поправит одну из моих невольных ошибок, чему я буду только рад. Начинающие же (а статьи ориентированы в первую очередь на них) да не пропустят ни слова;)

Основных характеристик "цифрового звука" три: частота сэмплирования (или квантования, ее еще называют sample rate), разрядность (глубина) бит (или попросту битность, или sample width), и количество каналов . AudioCD по этой схеме имеет параметры 44100/16/2. Можно грубо сказать, что для получения этого формата 44100 раз в секунду замерялась громкость звука по линейке высотой 2^16=65536 условных "звуковых миллиметров", иначе - шагов квантования . По этим же делениям она была жестко "округлена" (в кавычках - потому что шаги квантования отнюдь не обязаны быть целочисленными).

Изобразим условно аналоговый звук так:

Есть циничное мнение, что источников аналогового звука в природе вообще не существует - просто его разрешающая способность куда серьезнее. А среда распространения звука - воздух, например - является естественным фильтром очень высокого порядка;). С другой стороны, любую форму сигнала, какой бы сложной или ломаной она ни была, можно "собрать" из вот таких простых синусоид.

NB: ухо человека представляет собой очень сложную систему, в центре которой - коническая резонансная трубка-мембрана. Она имеет около 25 тысяч (!) окончаний нервных клеток-"микрофонов", каждая из которых "настроена" на свой диапазон частот (это просто и гениально обусловлено ее расположением на конической, напомню, мембране). Человеческий мозг воссоздает картину звука, получив сигнал, сведенный из этого безумного 25-тысячеканального микшерного пульта. Понятно, что технически создать такую модель, мягко говоря, сложно, да и, по счастью, не является необходимостью.

В электронном же мире звук превращается в аналоговый электросигнал вслед за колебаниями тоненькой круглой (плоской или слегка выпуклой) мембраны микрофона, порождаемыми мгновенной суммой амплитуд волн всех частот, ударяющих в нее. В том числе частот и гармоник, человеческим ухом не улавливаемых. Посмотрим, что происходит с этим электрическим, но все еще аналоговым сигналом при оцифровке с низкими и высокими частотой сэмплирования и разрядностью:

Как видим, "мелкоячеистая" сетка с высокими частотой (вертикальные линии) и разрядностью (горизонтальные линии) передает сигнал намного достоверней.

Разрядность 16 бит в формат бытового аудио тоже заложена буквально по минимуму, и для профессиональной работы со звуком используются разрядности в 18, 20, 24 и 32 бит (хотя на первый взгляд разница невелика, высо " ты таких линеек резко взлетают с 65535 в 1048576 (20бит) и 16777216 (24бит) "звуковых миллиметров". Размах же 32-битной шкалы даже произнести непросто: 4.294.967.296) . С точки же зрения файловой системы занимаемый треками объем при переходе от 16 к 24 битам возрастет всего в 1,5 раза, а к 32 битам - ровно в 2.

Количество каналов.... думаю, объяснять разницу между отжившими моно и квадро, вездесущим стерео и современными 5.1 и 7.1 сегодня не нужно даже младшеклассникам.

Еще одна характеристика - громкость, более правильно - амплитуда , или размах сигнала. Хотя по определению амплитуда может быть только положительной, часто так называют и мгновенное значение напряжения сигнала (а оно вполне может быть отрицательным). Амплитуду часто измеряют в децибелах (дБ или dB), и эта единица так же непроста, как и разрядность. Дело в том, что децибелы измеряют не абсолютные, а относительные величины . Скажем, между амплитудами в 0.5 и 1 вольт разница всего в полвольта, в dB эта разница равна 6. А между амплитудами 110 и 220 вольт разница - уже 110 вольт. Тем не менее, в децибелах разница... снова равна 6! Дело в том, что 6dB означает соотношение амплитуд как 1:2, независимо от того, какие именно значения принимают в данный момент амплитуды. Более того, шкала, по которой измеряются децибелы - логарифмическая. К чему все эти сложности? Наши уши воспринимают звук по логарифмической шкале, и от этого никуда не деться. Вот краткая справочная таблица для перевода отношений амплитуд в децибелы:



dB Отношение
0 1.00
1 1.12
2 1.26
3 1.41
5 1.78
6 2.00
8 2.51
10 3.16
20 10.0
40 100.0
60 1 000.00
80 10 000.00
100 100 000.00

Кроме того, у дорожки в целом есть и такая характеристика, как динамический диапазон (разница между самым тихим и самым громким звуками, при этом совсем необязательно самый тихий звук в дорожке окажется тихим вообще;) ). Чем шире диапазон - тем естественней звучат голоса, спецэффекты и "живые" музыкальные инструменты. Сжатие динамического диапазона позволяет усилить тихие звуки, не давая при этом громким "вырваться" за очерченные пределы. Такой процесс называют компрессией звука. Звук становится более плотным, иногда более ярким, но при излишнем усердии живые инструменты заметно "опластмассятся", а голоса станут похожими на пропущенные через (достаточно качественный, правда) радиотракт; спецэффекты же потеряют часть эффективности ;), основанную на резком изменении громкости. Например, накладываемый в фильмах любительский дубляж часто подвергается довольно жесткой компрессии, порой совершенно излишней. Понятно, что динамический диапазон косвенно ограничен разрядностью сигнала.

Потери, связанные с описанными характеристиками и их преобразованиями.

Частотные. "Стандартные" компьютерные частоты сэмплирования, по счастью, кратны друг другу: 44100, 22050, 11025 и т.д. Это помогает избежать ряда проблем с искажениями при преобразованиях и, в частности, появления низкочастотных огибающих, которые мы можем получить при преобразовании "некратных" частот - к примеру, 48000 "киношных" и 44100 "компьютерных" могут дать нам, помимо прочего, искажения в районе 48000-44100=3900 герц - прямо в центре слышимого диапазона (все, кто хоть немного сталкивался со струнными инструментами, отлично знают на практике, что такое "биение частот" при подтягивании струн в унисон). Но это еще не все подарки мирового кинематографа: "благодаря" формату NTSC мы имеем т.н. "пониженные" частоты - 44056 и 47952 Гц. Вкратце, это связано с "рваной" частотой NTSC в 29.97 кадров в секунду, в то время как синхрокод SMPTE, согласующий работу устройств в студии, "отрабатывает" ровно 30. По счастью, встреча с такими оцифровщиками и их продуктами сегодня маловероятна. Цифровая спутниковая телесвязь, и за ними DAT-магнитофоны тоже не остались в стороне, присовокупив от себя частоту сэмплирования 32000 Гц, что, впрочем, на фоне проделок NTSC выглядит детской шалостью.

Далее, при передаче цифрового сигнала от одного устройства к другому мы не застрахованы от искажений в низких частотах, связанных с несовершенством цифровых интерфейсов. Обо всем этом написано столько, что мы просто обозначим для себя: насколько возможно, следует избегать преобразования частот (особенно некратного) и передачи сигнала даже по, казалось бы, чисто цифровым интерфейсам. Всем этим условиям отвечает обработка звука полностью внутри компьютера - мы теряем только на входе. (С другой стороны, если у Вас вдруг окажется профессиональный внешний, специально предназначенный для преобразования частоты сэмплирования прибор, лучше воспользоваться им. Правда, это дорогостоящая техника, да и качества программной обработки вполне достаточно для дорожек к мультикам или самодельным концертным записям).

Есть искажения, на которые мы повлиять не можем - например, зависящие от собственной частоты звука. По совести, для полноценного восстановления синусоиды частотой 20КГц частота сэмплирования должна бы быть далеко не 44КГц (44100/20000=2.205 замера явно мало для восстановления двух полуокружностей! Вместо них мы получим две "ступеньки" - см. графики в начале статьи), в идеале - несколько сот (!) килогерц. К счастью, этот тип искажений худо-бедно компенсируют современные фильтры высоких порядков, "отбрасывающие" большинство образующихся гармоник-искажений. По этой же причине микросхемы современных усилителей для качественной передачи звука работают с частотами от десятых долей мегагерц и выше .

Еще одна очень неприятная потеря - т.н. детонация частоты ("wow", "flutter"). Возникает она на аналоговых носителях в случае, если лента по каким-то причинам ("бьющий" прижимной резиновый ролик или тонвал, и т.д.) движется "рывками" или с плавным ускорением-замедлением, либо сама лента уже деформирована лентопротяжным механизмом. Это приводит к изменению высоты тона и, при более явном проявлении, к нарушению ритмического рисунка. Я однажды с ужасом наткнулся на грампластинку с записью Тони Йомми, дорожки на второй стороне которой были... отпечатаны не по центру диска (!). Качание звука было то еще, да и визуальное гуляние тонарма и самих дорожек переплюнуло целый ряд "мультяшных" граммофонов. Почему я отдельно упоминаю о пластинках? Дело в том, что автоматического способа исправления таких искажений нет, и в ближайшее время он вряд ли появится . Если фонограмма имеет неоспоримую ценность, то имеет смысл помучаться с ней вручную, "подгадав" в несколько дублей период качания по паре десятков колебаний и наложив "противофазные" искажения (подробнее об этом позже); но и это справедливо только для ленточных детонаций, т.к. пластинка по мере продвижения ее спиральной дорожки к центру диска... вот-вот. Угловая-то скорость неизменна, а линейная - увы.

Амплитудные. Следующий тип искажений связан с любыми преобразованиями, даже в виртуальных устройствах - это погрешности при необходимости снова "привязывать" полученные нами громкости сигнала к "высоте" разрядной линейки. Компьютер как таковой от них, конечно, уже не спасает, и в нашей воле - только выбор компромиссной разрядности при обработке (и хранении) сигнала. С действительно качественным звуком имеет смысл работать не ниже 24-32 бит (хотя многие даже не заметят разницы в звучании). Используемые программы при таком принципиальном подходе желательно проверять на честность обработки - так как порой она не соответствует заявленной производителями (во время обработки звук может быть пересчитан в 16 бит). Для проверки можно воспользоваться, например, BitPolicy.

Отдельный и важный разговор - об оптимальной амплитуде обрабатываемого сигнала. Работа с тихим сигналом - в небольшой "нижней" части амплитудной линейки - понижает его разрядность, так как всякий раз после любой обработки мы округляем полученный размах к нескольким, пропорционально "укрупнившимся" ее ступенькам. Так можно "уронить" разрядность до 14 бит и даже ниже. Фактически, 16-битный сигнал в -24dB (около 6% макс. амплитуды) имеет разрядность в 12 (!) бит - "высота" соответствующей ему части линейки - всего 4096 делений! Пара упомянутых мной во вступлении мультфильмов имела именно такую амплитуду, но зато звук гордо замотан в AC3 с частотой 48 КГц. Знай, мол, наших. Кстати, для достижения 12-битным звуком качества 44100/16 частоту сэмплирования пришлось бы поднять до 705.6КГц!


Чем ниже амплитуда, тем большим искажениям при обработке она подвергается.

Слишком же большая амплитуда, в свою очередь, может приводить к тому, что сигнал окажется выше самого "высокого" деления амплитудной "линейки". Это так называемый "клип" (clip) - "отрезанная", навсегда потерянная часть сигнала. "Звучат" клипы по-разному: полученные при обработке - как резкие сухие щелчки, при оцифровке - как глуховатый треск, и малозаметный "теплый" перегруз на более дорогих, профессиональных оцифровщиках, которые стараются по мере сил мягко лимитировать их до допустимого максимума. Подобные мягкие искажения близки к "живым" аналогам - скажем, к катушке динамика в акустической системе, которая дошла до максимума своего движения в магнитном поле, или магнитной пленке, попавшей в такое поле, при котором "дополнительное" намагничивание уже невозможно.

Разумным компромиссом при обработке будет выбор амплитуды, над которой останется небольшой "воздух", от -3dB или чуть больше ("на глазок" в редакторах - до 30% свободного пространства от полной высоты аудиотрека). При записи сигнала, в предсказуемости которого (или в самом звуковом тракте) нет уверенности, верхний порог следует отрегулировать уровнями записи ближе к -6dB - это наверняка защитит Вас как от перегрузок платы во время неожиданного "всплеска" в звуке, так и от "запирания" в микшерном пульте или промежуточном усилителе (NB: метку "0 VU" аналоговых выходов студийного оборудования подстраивают и под -12, и даже под -15dB уровня цифровых рекордеров!) . Альтернатива - использовать лимитер, если он у Вас, конечно, есть. Это позволит Вам не только сгладить ошибки с уровнем при оцифровке, но и снивелировать действительно ненужные пики; кроме того, при умелом подходе, Вы сможете немного "накачать" общую амплитуду, не испортив сигнал для дальнейшей обработки. Конечно, при вдумчивом и уважительном обращении.

По окончании работы со звуком (но не раньше) можно нормализовать дорожку (см. часть 2) вплоть до -0.2dB - визуально примерно на 97% от максимального размаха. По другим рекомендациям, самый мощный сигнал при финальной нормализации не должен превышать -0.5дБ. Выравнивать пики под 0dB в любом случае не стоит. Заметного изменения громкости не произойдет, а вот к проблемам такой уровень приведет запросто. Здесь неплохо поставить точку еще на одном часто возникающем вопросе - чувствительность человеческого уха: вблизи порога слышимости она составляет 2-3dB, а на средних уровнях - около 0,4dB.

Разрядность и... шум . На первый взгляд связь между ними уловить трудно, на деле же - это еще один подвох квантизованного звука. И еще один довод не работать без нужды с тихим сигналом. Для идеального (идеального, подчеркну) теоретического преобразователя всегда существует максимальное соотношение сигнал/шум, которое он может обеспечить, и оно в первую очередь зависит именно от амплитуды. Все очень просто: даже при нулевом шуме соотношение сигнал/шум не может быть больше, чем весь динамический диапазон, предоставляемый разрядностью. Существуют две формулы, более точная и упрощенная (1 и 2 соответственно):

1.76 + (число бит * 6.2) = отношение сигнал/шум

2 + (число бит * 6) = отношение сигнал/шум

Таким образом, как ни крути, а 12-битная глубина физически не сможет обеспечить сигнал/шум больше, чем 74dB (звучание магнитофонной деки или FM-радиостанции). Для сравнения: 8-битный звук дает 50dB (радиовещание "старых", средневолновых станций), а 16-битный - 98dB (полный динамический диапазон симфонического оркестра). С реальными же, а не теоретическими оцифровщиками эти цифры, конечно, еще ниже - в эту копилку подкидывают свои монетки погрешности параметров электронных компонентов, недостатки экранировки аналоговой части, помехи соседних цифровых устройств, и т.д.

Потери от уменьшения количества каналов мы рассматривать не станем:).

    Подведем итоги первой части:
  • увеличение частоты сэмплирования и разрядности сигнала хорошо отражается на его достоверности;)

  • лишние преобразования (и особенно передача сигнала между устройствами), пусть даже в цифровой форме, искажают сигнал; как следствие - частоту сэмплирования выходного трека следует выбирать сразу при оцифровке и, если целью является просмотр на компьютере, лучше сразу установить ее в 44100, чем в 48000 с последующим (да к тому же "некратным") преобразованием.

  • максимальный пик сигнала желательно "подгадывать" при записи сигнала с непредсказуемой динамикой (либо на непредсказуемой аппаратуре) под -12dB - -6dB; в процессе обработки - в -6dB - -3dB, чтобы максимально уменьшить искажения при обработке и оставить при этом безопасное пространство для будущего изменения формы сигнала. (NB: при многоканальном сведении также неплохо удерживать уровни треков в диапазоне -12dB - -6dB). Финальную нормализацию микса или обработанного трека правильно делать ниже 0dB, в диапазоне -0.5dB - -0.2dB.

P.S.: на самом деле еще многие "мелочи" и подвохи цифрового мира остались за кадром. К примеру, записывая тот же сигнал в 20КГц, вы всякий раз чудом попадаете в кнопку "Rec" именно при прохождении синусоидой нуля? Нет? Значит, каждый ваш дубль "даст" на осциллограмме (а значит, и в звуке) каждый раз совершенно различные результаты! И не только на этой частоте, но и, естесственно, на всех остальных. Остался за кадром и такой момент, как инерционность человеческого уха (а ведь оно, как и глаз, принимает свои слишком быстро сменяющиеся "слуховые кадрики" за плавное непрерывное "движение" звука), и прочее, о чем и без меня всюду и много. Мы же перейдем к

Восстанавливаем старые записи

2 Февраля 2015
Не так давно на Хабре проскакивала новость о том, что учёным удалось восстановить одну из очень старых записей, сделанную ещё в 1905 году, не повредив при этом носитель. Основным достижением тут является как раз факт целостности носителя, так как запись сделана была не абы на чём, а на восковом цилиндре. Это чуть ли не самый первый изобретённый способ записи\воспроизведения звука, который широко использовался. До этого носителем были стеклянные цилиндры с сажей (воспроизводить их правда не умели), затем покрытием стала фольга и лишь потом воск.

Я, разумеется, заинтересовался таким-то раритетом и решил послушать как там люди вообще жили-то, в далёком 1905-ом...К моему удивлению, оригинальная запись оказалась достаточно шумной, хоть и утверждалось, что она была обработана различными шумоподавляющими алгоритмами и т.д... Стоит отметить, конечно, что по сравнению с другими восстановленными с восковых цилиндров записями, эта действительно была весьма хороша - по качеству уже вполне сопоставимо с первыми пластинками. Однако, как известно, лучшее - враг хорошего.

Я вообще любитель старых довоенных песен, и зачастую приходится немного обновлять звук добытых из глубин сети экспонатов. В частности, например, этим страдают записи песен из старых фильмов, так как там и сам оригинал фильма не блещет качеством звука.

В рассматриваемом нами случае, мы имеем, фактически, слепок дорожки, сделанный лазером. Я сейчас не рассматриваю тот факт, что господа археологи тоже применяли какие-то процедуры к исходному звуку, однако буду считать что они пытались максимально точно воспроизвести оригинал. Так как линейные размеры дорожки, в данном случае, достаточно велики, говорить о погрешностях оцифровки практически не приходится, тем более для исходного файла выбрана достаточно высокая частота дискретизации, примерно в четыре раза превышающая частоту звуков в записи. Значит можно считать, что перед нами практически идеальный слепок оригинальной звуковой волны.

Тут мы сталкиваемся с особенностями материала и самого способа воспроизведения.

Факт номер раз: материал, из которого сделан цилиндр достаточно мягок (воск), на нём, даже будь он идеально новым, невозможно запечатлеть звуки с длинной волны меньше определённого значения.
Факт номер два: помимо материала вносит свои коррективы и сама технология записи на такие цилиндры - звук писался буквально иглой по цилиндру.
Факт номер три: воспроизведение такого цилиндра само по себе разрушало носитель.

Первый факт даёт нам ограничение максимальной частоты записи примерно в 5-6 кГц и, как мы увидим в дальнейшем, это очень важно. А второй и третий факт сообщают, что о сохранении крутизны фронтов и форме волн можно особо не беспокоиться - не та точность, изначально.

Для начала включим спектральное представление сигнала и возьмёмся за эквалайзер (а эквалайзер это ведь наше всё).

Что мы видим на спектрограмме? Частота дискретизации файла у нас аж 22000 кГц, при этом никаких звуков в записи, как мы видим, нет выше 4.5 кГц, чего и следовало ожидать (см. факт номер раз). Однако, если присмотреться повнимательнее, какая-то грязь всё-таки просачивается выше (чтобы лучше было видно, повысил контрастность и яркость в квадрате, обведённым красным). Откуда оно берётся непонятно, но не вдаваясь в детали мы первым же делом можем с чистой совестью порзать всё выше т.н. "частоты Найквиста" для нашей частоты дискретизации (11 кГц). Так как запас там ещё приличный, я не стал мелочиться и убрал всё выше 8 кГц, а также ниже 100 Гц, так как там, судя по спектрограмме, тоже ничего дельного не было.

Немного поразмыслив, я подошёл к этому моменту ещё более радикально, а именно - не стал морозится с эквалайзером, а начал всё с начала и сразу изменил частоту дискретизации файла до 11 кГц.

Далее, не мудрствуя лукаво, воспользуемся инструментом, который есть во многих современных аудио-редакторах: Noise Reduction. Идея проста - выделяем место в треке, где у нас нет ничего кроме шумов. Далее создаём паттерн этих шумов (Capture Profile). В простейшем случае вам будет достаточно одного единственного ползунка Noise Reduction Level.

Он там, правда, говорит, что у них, якобы движок обновился (речь о версии CS5.5) и они теперь умеют не создавать лишних артефактов при шумоподавлении, но, мы-то с вами знаем, что разница практически отсутствует. И настройки все те же, разве что окошко в новой версии перерисовали.

Есть ещё некоторые нюансы которые этот харизматичный мужик в видео не затрагивает, например "ширина окна" для преобразования Фурье (FFT Size).

Ширина окна влияет на частотное и временное разрешение сигнала - при увеличении ширины окна повышается частотное разрешение, но уменьшается временное разрешение и увеличиваются вычислительные затраты на выполнение быстрого преобразования Фурье.

Если не вдаваться в подробности, при избавлении от случайных (это важно) шумов, следует стремиться использовать как можно большее число точек (Snapshots in profile) при максимально возможном на данном отрезке FFT Size. Всё это значит, что для качественного "шумового профиля" нам нужен как можно более длинный отрезок, в котором есть только шумы. Вообще, чем хорош Noise Reduction, так это тем, что его можно использовать не только для шумов, но и для различных фоновых звуков (шум леса, дождя, etc.)

На самом деле, в том же SoundForge есть и более интересные инструменты, например возможность вычитать из сигнала волну произвольной формы, но я начинал пользоваться Audition"ом, ещё в бородатые времена, когда он звался CoolEdit, и тогда SoundForge даже близко ничего похожего не мог, а теперь мне уже лень браться за что-то новое.

Я привычно взялся искать в файле отрезок с шумами, но оказалось, что они слишком короткие и при формировании выборки по ним, можно было составить только слишком короткие паттерны. Из-за этого либо шумоподавления не было слышно вообще, либо появлялись дичайшие артефакты. Тут я стал думать как же мне с этим быть. А пока думал, решил зайти с другого конца.

Самыми раздражающими в нашем случае являются мягкие щелчки, а также периодичный шум, следующий сразу за щелчками. Я думаю этот эффект появился вследствие отклонений поперечного сечения цилиндра от формы круга, либо ось не ровно стояла. В какой-то момент, при записи, иголка слишком глубоко входила в воск (начальный щелчёк) и дальше короткий отрезок шла по неровности (продолжающийся несколько раз после щелчка характерный шум), далее цилиндр делал полный оборот и шум повторялся. Как мы увидим далее, от этого шума нам всё-таки удастся избавиться с помощью Noise Reduction, однако продвигаясь по файлу и просматривая форму волны, я заметил, что тут присутствуют ещё и достаточно странные косяки, похожие на характерные искажения A\B-усилителей. Очень характерный пример на заглавном скрине статьи, но там ещё достаточно спорно, так как у того искажения слишком длинный период (я выбрал наугад из файла). А вот на следующем скрине видно очень хорошо что я имею ввиду.

О том как эти штуки (не )надо лечить и почему, я решил написать отдельно, а чтобы статья слишком не разрослась, спрятал под спойлер. Можно пропустить этот кусок, это почти что лирическое отступление.

О том, как убирать искажения не надо и почему

На скрине выше не очень хорошо видно, так как я чуть отодвинулся для масштаба, но длительность такого колебания - жалкие 80 микросекунд. Проделываем нехитрые вычисления:

T = 0.00008 мс (период)
F = 1 / T = 12500 Гц (частота)

Самое время вспомнить первый факт, озвученный ранее: очевидно, в подобной записи 12-ти килогерцам взяться неоткуда, так что практически наверняка это тоже шумы. Тут можно было бы обратиться к спектрометру, однако, так как эти колебания имеют совсем уж мизерную амплитуду, а кроме того, их, почему-то, слишком много, на спектральном представлении они совершенно не выделяются и похожи на тёмный-тёмный точечный фон (картинка с более контрастным квадратом это как раз оно и есть).

Врядли такие косяки возникли из-за движения иглы. Я полагаю это микро-трещины на воске, которые появились, скорее всего, из-за времени.

В идеальном случае, может показаться будто было бы круто просто взять и вырезать такие места, причём целыми периодами: так как эти колебания приходятся на места, где у нас фактически дефекты записи, однозначно можно сказать, что никакой полезной информации они не несут, а так как нам не принципиально сохранение оригинального тайминга композиции, мы могли бы смело их удалять - в среднем они длятся не более 100 мкс, это совершенно мизерный промежуток, на слух такое заметить нереально.

Только вот, живём мы не в идеальном мире (хотя, это как посмотреть), так что это достаточно скверная идея. Дело в том, что при удалении участка, происходит т.н. smoothing, т.е. сглаживание уровней соседних точек. Так как это у нас цифра, такие мельчайшие неровности после сглаживания это самый натуральный В/Ч шум. Мы его немного ограничили снизив частоту дискретизации файла, но тем не менее. Тут можно было бы попробовать порезать такой шум эквалайзером после всех удалений, но, опять же, это изменит форму волны, а в силу того что звук у нас цифровой, тут всё упирается в математику - сделать эквалайзером ровный срез по нужной частоте просто так не получится. Кроме того, как я говорил выше, таких искажений слишком много, отчего ручками вот так всё править практически бессмысленно - такие фрагменты имеют длительность порядка 100 мкс, а значит для того чтобы это "улучшение" было хоть немного заметно на слух (теоретически), вам нужно удалить просто невероятное количество таких участков. При этом, так как в остальном файле эти искажения никуда не денутся, "чистый отрезок" в пару миллисекунд будет банально незаметен на фоне шумных. И ещё бочка дёгтя - результаты сглаживания сотен удалённых отрезков создадут такой шум, что первоначальный вариант (который был без правки) покажется вам даже лучше того что у вас в итоге получится.

Помимо всего перечисленного, волны порой интерферируют друг с другом совершенно невообразимым образом (простите за тавтологию), отчего однозначно понять где конкретно искажение, а где, скажем сибилянты, очень сложно - для этого, как минимум, нужно хорошо знать особенности человеческой речи, формирование гармоник и всё остально. Так что, даже если бы не smoothing, при таком удалении есть неиллюзорный шанс банально попортить изначальный звук, сломав интерференционную картину.

И тем не менее, лекарство от данных болячек есть - ниже я покажу как подчищать звук, в том числе и от подобных искажений.

В один из моментов, когда я рассматривал спектрограмму сигнала, до меня дошло, что в конце песенки, есть достаточно длительный момент, когда ничего, кроме "свиста птиц", не звучит. А свист этот на спектрограмме имеет вполне однозначную полосу.

А значит мы можем схитрить. Расчехляем эквалайзер, выставляем максимальный Range (это динамический диапазон, говоря проще, на сколько дБ будет усилена\ослаблена та или иная частота) и режем частоты на которых у нас поют птицы, а всё что ниже\выше оставляем.

Так как даже максимального динамического диапазона не хватает чтобы полностью прибить всех птиц, повторяю эквалайзер дважды. Вообще, про то как он работает, и почему так всё происходит, можно отдельную статью писать, только, боюсь, я не настолько хорошо знаю математику алгоритмов чтобы на эту тему умничать.

Итак, теперь мы имеем достаточно длинный отрезок с одним лишь шумом... и, правильно, возвращаемся к тому, с чего начинали. Захватываем профиль шума (после захвата нажимайте close, а не cancel, ибо иначе все настройки сбросятся к предыдущим использованным).

Помимо Noise Reduction, ещё есть фильтр Hiss Reduction, он, как следует из названия, поможет нам избавиться от свиста и всякого разного подобного. Настройки там почти аналогичные шумодаву, разве что FFT Size как-то по другому работает, а как именно я так и не разобрался, поэтому действую тут эмпирическим путём, чего и вам советую. Для Hiss Reduction тоже необходимо указать базовый уровень шума (кнопка Get Noise Floor), так вот, этот базовый уровень захватывать стоит на том же отрезке, на котором мы захватывали шумовой профиль.

После применения этих двух разновидностей шумодава, мы получаем уже вполне годный к потреблению результат. Разве что, небольшие артефакты на концах спектра появляются. Тут нам на помощь снова приходит эквалайзер - нещадно режем всё ниже 150 Гц и выше 4.5 кГц.

Стало заметно тише, но щелчки до сих пор слышны. Теперь в дело снова идёт спектрометр. Если на данном этапе послушать файл и наблюдать за спектрограммой, будет очевидно, что в момент щелчка шум имеет весьма широкий спектр, а вот мелодия, напротив идёт чёткими волнистыми линиями (ниже, для наглядности выделил один щелчок красным).

Для начала устраним апмлитудные всплески на местах щелчков. Для этого переключаемся в режим отображения формы сигнала. Как правило, это всего один "зашкаливающий" период волны.

В случае, если этот период был просто слишком громким, то я обычно просто делал его тише. Если он был ещё и сильно искажен, то удалял целиком (лень выправлять каждый, чего уж тут).

А тут я расскажу как буквально в два щелчка править амплитуду таких скачков.

Хинт о том, как удобно юзать избранное в Audition

Собственно, идея тривиальна. В Audition для произвольного участка записи мы можем задавать определённый график изменения громкости (Amplitude and Compression -> Envelope). Т.е. например можем сделать плавное затухание, или резкое появление. Ну в общем, нарисовать можно, что душе угодно. Обычно этот инструмент применяется для больших масштабов. Однако, я придумал как его можно использовать на микромасштабах. Открываем "Избранное" (Окно->Избранное) и создаём новый пункт. Выбираем эффект Envelope и правим настройки. В настройках создаём простейший график-дугу, с одной единственной точной-минимумом ровно по центру графика (50% время, 50% амплитуда). Придумываем имя, сохраняем и двигаемся к нашему первому щелчку.

Теперь вам надо всего лишь выбрать на максимальном приближении один период волны "щелчка", который зашкаливает и два раза щёлкнуть по созданному эффекту в избранном. Вуаля - щелчёк по уровню становится примерно равен окружающим его колебаниям. Этакий "ультрапрецизионный софтлимиттер". В принципе можно добиться аналогичного эффекта и Hard Limiter"ом, но он порежет под один уровень все звуки в треке, а нам надо резать только ненужные. Кроме того там ещё есть ряд нюансов - например часто просто невозможно подобрать такие настройки, при которых лимиттер режет только то что нужно, например, когда щелчки слишком резкие.

После того, как самые громкие щелчки были побеждены, пришло время избавляться от мелких искажений, которые есть по всему файлу. В предыдущем спойлере я уже рассказал как их удалять не стоит, а сейчас расскажу как делать это более-менее правильно.

Тут нам снова пригодится спектральное отображение сигнала. Если зорким взором окинуть панель инструментов в этом режиме, в глаза бросается вещь, вроде бы совсем не связанная с миром аудио-редакторов. Кисть. Она-то нам и нужна.

Она позволяет удалять произвольные участки на спектре. Будто динамический сверх-точный эквалайзер.

Помните я писал, что щелчки имеют широкий спектр, а вот музыкальные звуки хорошо читаются на их фоне? Сейчас мы этим и воспользуемся. Выбираем эту кисть, ищем момент где у нас идёт такой вот столбик шума на фоне музыки. Далее рисуем этой кистью в местах где у нас только шум, не затрагивая при этом музыкальную линию. Далее нажимаем del, затем передвигаем ползунок выделения чтобы просмотреть чё у нас получилось, либо просто начинаем рисовать кистью на новом месте. И видим что там, где только что удаляли, у нас теперь темнота, то есть тишина.

Только это неблагодарное занятие, на самом деле. Потому что в реальности звуки имеют гораздо более сложную природу и помимо шумов между главными гармониками часто присутствуют менее важные призвуки. Но несмотря на то, что они менее важны, они придают звуку более естественный окрас и характерность, чего можно лишиться, если приняться выпиливать вообще все не гармонические звуки.

Кстати, помните я писал про то, что при удалении периодов появляется некий шум, которому вроде как и взяться неоткуда? Долго работая кистью в спектрографе, можно заметить что даже в этом режиме такой шум тоже иногда появляется - вокруг удалённой области непонятно откуда появляются белые участки - это оно и есть.

Внимательный читатель, наверняка ещё задаётся вопросом, а почему я, для того чтобы получить профиль шумов (там где "свистят птицы") использовал эквалайзер, а не эту "кисть", коль скоро там ничего, кроме свиста нет?

На самом деле вопрос хороший, так действительно можно было бы сделать, но мне, во первых лень было обводить всю огибающую, а во вторых, т.к. свистит тут у нас не идеальный синтезатор, остаётся вероятность наличия в свисте дополнительных гармоник, которые также присутствуют и в остальной песне. А если мы посчитаем на их основе шумовой профиль, то, очевидно, ошибочно избавимся от них при обработке. Хотя, на самом деле, конечно, основную роль конкретно в этом случае сыграла моя лень...

Итак, в качестве финальных штрихов прогоняем Automatic Click remover в режиме чуть сильнее среднего (верхний ползунок 30, нижний 75) - он уберёт резкие щелчки, которые могли появиться в результате наших манипуляций. И эквалайзером ещё раз срезаем всё выше 5 кГц и ниже 100 Гц. Далее нормализуем файл до 100%. Я ещё удалил самое начало файла, буквально полсекунды где-то, там всё равно после всех наших манипуляций ничего не осталось.

Кстати, в оригинальной статье не было упоминания, да и теги в файле проставлены не были, исполнители оригинала: Harlan And Belmont.
А Byron Harlan даже есть на

Глава 3 Реставрация старых записей

Качественные компьютерные системы шумопонижения сделали возможным появление множества программ для реставрации старых звукозаписей. Система реставрации – это не только шумопонижение. Это целый комплекс взаимодополняющих функций, таких, например, как декликер (удаление щелчков), система распознавания и удаления характерного шипения грампластинки и др. Одна из самых трудных задач при реставрации звукозаписей – устранение нелинейных искажений.

Как известно, архивные записи, хранящиеся на магнитофонных лентах и виниловых пластинках, со временем теряют первоначальное качество звучания. На них появляются различные шумы и помехи, мешающие нормальному прослушиванию и портящие общее впечатление от записи. Наиболее часто встречающиеся дефекты – это импульсные помехи (щелчки) и фоновые шумы (шипение магнитофонной ленты, шум при воспроизведении с винилового диска), вызываемые плохими условиями хранения или недостаточно хорошим качеством первоначальной записи.

С возрастанием мощности современных компьютеров и появлением более сложных алгоритмов обработки звуковых сигналов открылась возможность восстанавливать архивные фонограммы путем сложной вычислительной обработки исходного сигнала при помощи компьютера. Такой способ восстановления звука обладает чрезвычайно высокой эффективностью и гибкостью, позволяет устранять помехи, щелчки, фоновый шум и другие дефекты записи. Без сомнения, это одно из важнейших достижений в области компьютерной обработки звука. Главное достоинство данного метода состоит в том, что в отличие от обычных систем шумопонижения, действующих по принципу фильтрации частот, компьютерная реставрация, по мнению разработчиков программ, не оказывает практически никакого отрицательного влияния на основной сигнал (это утверждение, однако, оспаривается многими экспертами и любителями музыки).

Средства удаления шумов с фонограмм включаются в профессиональные редакторы звука обычно в виде дополнительных программных модулей. Кроме того, разработаны программы, предназначенные специально для восстановления аудиозаписей. Одной из них является выпускаемая фирмой ZH Computer, Inc. программа DART Pro 32, которая содержит полный набор средств, позволяющих качественно удалить с записи импульсные помехи и фоновые шумы. Кроме того, с ее помощью пользователь может редактировать восстановленную фонограмму. Таким образом, DART Pro 32 позволяет достичь отличных результатов при реставрации любых фонограмм.

Для аудиоредактора Sound Forge фирма Sonic Foundry выпускает дополнительный модуль Noise Reduction, удаляющий шипение магнитной ленты, помехи, вызванные электромагнитными наводками электросетей, и прочие шумы.

В программе WaveLab для реставрации используются два дополнительных модуля – DeNoiser и DeClicker.

Кроме того, в базовый комплект поставки WaveLab входит модуль эффектов Grungelizer, который выполняет функции, прямо противоположные описанным выше. Он используется для имитации старых «зашумленных» записей путем добавления в исходный сигнал таких специфических помех, как фон, создаваемый наводками переменного напряжения, щелчки и треск, характерные для виниловых звуконосителей, высокочастотное шипение, которое наблюдается при воспроизведении звука с помощью аналогового магнитофона. В дополнение ко всему перечисленному с помощью рассматриваемого модуля можно сужать частотный диапазон сигнала и имитировать перегрузку усилителя.

Из книги Давайте создадим компилятор! автора Креншоу Джек

Из книги Запись CD и DVD: профессиональный подход автора Бахур Виктор

Реставрация записи Программа Adobe Audition 1.5 имеет большое количество инструментов, позволяющих восстановить звук, записанный на компьютер с виниловых пластинок, кассетных и бобинных магнитофонов, а также удалить шипение, щелчки, перегрузку и другие нежелательные

Из книги Windows Vista без напряга автора Жвалевский Андрей Валентинович

Совместимость старых программ с Windows Vista Большинство программ, созданных для предыдущих версий Windows, успешно работают и в Windows Vista, но в работе некоторых приложений обнаруживаются сбои или же полный отказ от запуска. Все из-за того, что система отказывается запускать

Из книги Windows Vista автора Вавилов Сергей

Совместимость старых программ с Windows Vista Большинство программ, созданных для предыдущих версий Windows, успешно функционируют и в Windows Vista, однако в работе некоторых из них обнаруживаются сбои. Иногда встречается полный отказ от запуска из-за несовместимости приложения с

Из книги Обработка баз данных на Visual Basic®.NET автора Мак-Манус Джеффри П

Из книги UNIX: взаимодействие процессов автора Стивенс Уильям Ричард

ГЛАВА 9 Блокирование записей

Из книги Scrum и XP: заметки с передовой автора Книберг Хенрик

Подход №2: «Начинать реализовывать новые истории, но наивысшим приоритетом ставить доведение старых до ума» Мы предпочитаем этот подход. По крайней мере, до сих пор так и было.По сути, он состоит в следующем: когда мы заканчиваем спринт, мы переходим к следующему, но

Из книги Тайм-менеджмент для системных администраторов автора Лимончелли Томас

Удаление старых процедур Иногда приходится обновлять процедуры.В истории с заправкой автомобиля, рассказанной ранее в этой главе, я отметил, что в какой-то момент забыл, с чего началась эта процедура, но продолжал выполнять ее. Это вызывает некоторую тревогу. Правильно ли

Из книги Настройка Windows 7 своими руками. Как сделать, чтобы работать было легко и удобно автора Гладкий Алексей Анатольевич

Глава 5 Настройка и использование учетных записей пользователей В операционной системе Windows 7 учетная запись пользователя – это набор сведений, определяющих, к каким папкам и файлам пользователь имеет доступ, и какие изменения могут вноситься пользователем в работу

Из книги Разработка приложений в среде Linux. Второе издание автора Джонсон Майкл К.

25.4.1. Добавление записей Новые и обновленные записи заносятся в базу данных с использованием функции dpput().int dpput(DEPOT * dfepot, const char * key, int keySize, const char * data, int dataSize, int dmode);key представляет собой значение индекса, который впоследствии может использоваться для получения информации,

Из книги Linux: Полное руководство автора Колисниченко Денис Николаевич

25.4.2. Удаление записей Удаление записей из базы данных осуществляется путем вызова функции dpout() и передачи ей ключа, данные которого необходимо удалить.int dpout(DEPOT * depot, const char * key, int keySize);Заданный ключ и связанные с ним данные удаляются из базы, после чего возвращается

Из книги Linux и UNIX: программирование в shell. Руководство разработчика. автора Тейнсли Дэвид

6.2.5. Настройка сети в старых дистрибутивах Если вам недоступны графические конфигураторы, то можно настроить сетевой интерфейс и из командной строки.Добавьте в файл установленного оборудования (скорее всего, он будет называться /etc/conf.modules) сведения о своей сетевой

Из книги Как заработать в Интернете. 35 самых быстрых способов автора Фомина Ольга

Из книги Установка, настройка и восстановление Windows 7 на 100% автора Ватаманюк Александр Иванович

1. Заработать на старых вещах: сайты аукционы в сети, как заработать на них Интернет-аукцион (он же «онлайновый аукцион») – это торги, происходящие через сеть интернет. Отличаются от обыкновенных аукционов, тем, что проводятся на отдалении (на расстоянии) и в них можно

Из книги Цифровая фотография. Трюки и эффекты автора Гурский Юрий Анатольевич

Глава 11 Настройка контроля учетных записей пользователей С механизмом контроля учетных записей пользователей уже успели познакомиться те, кто работал в Windows Vista. Как и в Vista, в Windows 7 данный механизм призван защитить операционную систему от запуска разнообразных

Из книги автора

17.12. Окрашивание старых фотографий людей Большинство старых фотографий выполнено в монохромном цвете. Это придает снимку шарм и подчеркивает его почтенный возраст. С другой стороны, при взгляде на такую фотографию возникает ощущение, что часть информации была утеряна

Перезапись с магнитной ленты (винила)

Для того чтобы с аудиоматериалом можно было совершать какие-либо действия (чистку, коррекцию и пр.) его необходимо переписать с оригинального носителя (катушки, пластинки, микрофона). Методика записи с CD в данной статье не рассматривается.
Я рекомендую захват аудио осуществлять посредством программы WaveLab от компании Steinberg (можно использовать любую другую программу).
Предварительно производится соответствующая коммутация выходных цепей устройства-источника сигнала с линейным (или иным доступным) входом аудиокарты компьютера.

Примечание: коммутацию лучше осуществлять при выключенной аппаратуре, т.к. высока вероятность выхода из строя оконечных каскадов звуковой карты компьютера.

Программа WaveLab запускается ярлыком, находящимся в меню «Пуск» или на «Рабочем столе». Непосредственно после первого запуска программы необходимо в настройках программы в качестве аппаратного средства воспроизведения и записи указать используемый системой драйвер. В противном случае возможны проблемы при записи или воспроизведении.

Необходимо изменить некоторые настройки, определенные по умолчанию:

  1. Выбрать в поле «File to create» опцию «Named File (.wav)», что означает осуществлять запись в финальный файл.
  2. Указать расположение, куда будет записан файл и его название.
  3. В меню «Properties» указать параметры (частота дискретизации и битрейт). По умолчанию установлено 16 bit и 44,1 kHz. С целью повышения качества записываемого материала можно (при наличии аппаратной возможности) можно установить 24 bit / 96 kHz, однако это приведет к увеличению занимаемого полученным файлом места на диске.

Примечание: ориентировочно оценить, какой объем аудиоматериала с текущими настройками еще можно записать на HDD можно по полю «Disc Capacity».

  1. Подать аудиосигнал и ползунками выставить оптимальный уровень (по пикам -3 – -5 dB, иначе возможны нелинейные искажения)

Примечание: если микшер невидим, его можно открыть кнопкой «Mixer >>».

Примечание: чтобы раздельно настраивать уровень левого и правого каналов необходимо перемещать соответствующий ползунок, зажав клавишу «Ctrl» на клавиатуре.

После того, как все настройки сделаны, можно приступать непосредственно к записи (кнопки «Record» и «Pause»).

Примечание: для того, чтобы впоследствии можно было осуществить шумокоррекцию, необходимо захватить 2-5 секунд фонограммы при отсутствии полезного сигнала (шорох виниловой массы или шелест ленты).

Вся сторона рулона (или пластинки) пишется в один прием, в один файл.

После окончания записи откроется окно с записанным файлом:

Полученный файл, как и программу WaveLab, можно закрыть (или записать еще несколько файлов – для этого сразу перейти к пункту 4).

Удаление фонового шума

Я использую программу CoolEdit2000 компании Syntrillium , можно использовать плагин для SoundForge , суть работы не изменится.
Ярлыком запускаем программу, далее необходимо открыть записанный файл, подлежащий шумоудалению:

Необходимо визуально определить стыки отдельных дорожек (обозначено желтым). Первый стык, откуда будет взят «слепок» шума, указан красными стрелками.

Ниже приведен увеличенный фрагмент.

Примечание: менять масштаб можно при помощи колеса мыши либо кнопками с изображениями лупы в окне программы.

Необходимо выделить (левой кнопкой мыши) участок, продолжительностью 1-4 секунды, не содержащий ничего, кроме шума.

Далее, чтобы загрузить профиль в буфер шумоподавителя, выбираем «Transform» -> «Noise Reduction» -> «Noise Reduction…» и выставляем опции в соответствии со следующим рисунком и в указанном порядке (с опциями можно экспериментировать и целью получения оптимального для конкретной фонограммы результата).

После закрытия окна шумоподавителя необходимо выделить всю фонограмму (кнопка с изображением лупы на фоне листа и двойной клик в область фонограммы). Далее вновь открывается окно «Noise Reduction» с уже загруженным профилем и выставленными настройками и запускается (кнопкой «OK») процесс шумоудаления, продолжительность которого зависит от вычислительных мощностей компьютера.

Примечание: оптимальные параметры лучше всего подбирать на коротких фрагментах, на слух и по спектроанализатору оценивая полученное качество.

Разбивка записанной дорожки на отдельные треки

Получившуюся дорожку, содержащую в себе несколько отдельных произведений необходимо разбить на части. Удобнее всего делать это в аудиоредакторе SoundForge 8.0 .
Запустить программу ярлыком, открыть редактируемый файл:

Непосредственно после первого запуска SoundForge необходимо указать тип аудиоустройства:

Визуально определяются стыки треков:

Место стыка масштабируется (колесом мыши) до необходимого уровня. Далее в позиции, обозначенной красной стрелкой необходимо вставить маркер. Для этого кликают правой кнопкой мыши в области, выделенной зеленым:

Появился маркер «01», который можно передвинуть ближе к началу следующего трека:

Затем в конце трека можно плавно сбросить уровень сигнала (эффект «Fade»). Для этого выделяется нужная область (длина подбирается исходя из фонограммы) и применяется сам эффект:

Примечание: длину корректируемой области можно изменять путем перетаскивания края выделения.

Аналогичным образом происходит обработка начала трека, однако, длина корректируемой области в этом случае много меньше:

Примечание: уменьшение и увеличение уровня этими опциями происходит линейно. Если требуется получить нелинейный (параболический и пр.) «Fade», используют пункт «Графическое…».

Остальные стыки правят схожим образом.
Итогом вышеперечисленных действий станут обработанные стыки (начало первого и конец последнего треков корректируют аналогично) дорожек и семейство маркеров их разделяющих.

Иногда возникает необходимость привести уровни отдельных треков к единому значению, что особенно актуально для дорожек, записанных с различных источников. Для этого нужно выделить один трек (достаточно дважды кликнуть между маркерами) и применить фильтр «Нормализация…». Настройки подбираются экспериментально.

Сразу после нормализации одного трека его можно вставить в отдельный файл. Сперва уже выделенный фрагмент (если нарезка происходит после нормализации всех треков, то трек необходимо выделить снова) копируется в буфер обмена:

Затем копированный кусок вставляется в новый документ следующим образом:

В итоге получается отдельный файл, содержащий только один трек:

Примечание: переключаться между вновь созданным и исходным файлом можно с помощью меню «Окно»:

Аналогичным образом поступают со всеми оставшимися треками, причем желательно делать нарезку в той же последовательности, что и в оригинале. Это позволит избежать путаницы с нумерацией, т.к. SoundForge автоматически нумерует вновь создаваемые файлы.

Получился набор нумерованных несжатых файлов.

Конвертирование в формат mp3

Поскольку несжатый wav-файл занимает много места, его можно ужать, естественно за счет потери части информации, в формат mp3. Существует множество других форматов компрессионного аудио, но mp3 является самым распространенным.
Пакетное конвертирование (т.е. сжимать будем сразу несколько файлов) осуществляется с помощью уже известной нам программы WaveLab, в которой необходимо активировать опцию «Batch file encoding…»:

  1. Найти папку, в которой находятся обработанные нарезанные файлы. Выделить их все.
  2. Добавить их в лист кнопкой «Открыть»
  3. Указать папку-приемник для сжатых файлов
  4. Выбрать формат mp3
  5. Установить желаемый битрейт (лучше 192 kbps и выше)
  6. Выбрать высшее качество («Highest quality»)

После установки всех настроек окно приобретет следующий вид:

После нажатия на кнопку «Start» запустится процесс кодирования. Обработанный файл отмечается зеленой меткой, обрабатываемый – красным.

После окончания процесса кодирования в папке, которая была указана в настройках, появятся сжатые mp3-файлы.

Редактирование информации в mp3-тэге

Следующим шагом будет добавление к сжатым аудио-файлам информации о его названии, авторе, альбоме и т.п. Для облегчения этой задачи воспользуемся программой TagScaner (можно использовать любой аналог).
Программа запускается ярлыком, расположенным в меню «Пуск» или на «Рабочем столе». Сразу после запуска программы необходимо указать папку, в которой находятся mp3-файлы.

На следующем рисунке видно, что mp3-тэг не содержит какой-либо информации, поэтому его необходимо заполнить. Файл, информация которого правится, подсвечивается. После внесения всех необходимых исправлений информация дописывается к существующему mp3-файлу нажатием кнопки «Сохранить», при этом для правки автоматически открывается следующий трек.

Для добавления одинаковой информации ко всем трекам (название альбома, год, стиль, артист) можно, выделив все треки в левой части окна, внести информацию в интересующее поле. При этом метка означает, что данное поле разных треков содержит отличную друг от друга информацию и что она будет сохранена. Подтверждение сделанных изменений осуществляется нажатием кнопки «Сохранить».

Далее следует изменить структуру названия mp3-файла. В качестве элементов названия может участвовать любая информация из тэга (автор, заголовок, альбом, номер трека). Структура названия задается в поле «Шаблон» (в данном случае запись «%1 - %2» означает «Имя_артиста – Название_трека.mp3»). Для предварительного просмотра полученных названий можно воспользоваться кнопкой «Проба…».

Если результаты переименования Вас устраивают, можно переименовать редактируемые файлы кнопкой «Новые имена».

В итоге вышеперечисленных действий должна получиться группа именованных сжатых mp3-файлов с добавленной в тэг дополнительной информацией.

Запись на CD

После того, как наберется достаточное количество mp3-файлов, их можно записать на CD. Рассмотрим технологию записи с помощью программы NeroBurningROM .
Программа запускается ярлыком.
После запуска пользователя спросят о характере вновь создаваемого проекта. Для диска, который записывают целиком и который планируют использовать с IBM-совместимыми компьютерами и mp3-плеерами, можно выбрать тип диска «CD-ROM(ISO)», «Нет мультисессии» (эта опция сэкономит порядка 15 MB).

В окно проекта перетаскиваются отсортированные по альбомам, исполнителю, годам файлы. Объем, занимаемый файлами на CD, ориентировочно можно оценить по шкале в нижней части окна проекта – стандартному 700 MB диску соответствует синяя и желтая шкала (до красной зоны).

После того, как mp3-диск сформирован, его необходимо записать. Перед началом процесса записи (для удобства последующей идентификации диска в коллекции) ему можно присвоить название, соответствующее содержимому (например, автор), а также выставить параметры записи. Для лучшей совместимости с аппаратными mp3-плеерами и устаревшими компьютерами скорость записи устанавливается не выше 24-й (оптимально 16), и метод записи диска – «Disc-at-once». Также нужно активировать функцию защиты буфера рекордера от опустошения («BURN-Proof» или аналогичную).

За время существования аналоговой технологии записи и воспроизведения звука накоплены огромные архивы с поистине бесценными фономатериалами. Однако теперь уже мало кто предпочтет старые виниловые грампластинки и компакт-кассеты новым цифровым носителям звукозаписи. Новые требования к качеству звука, которые ныне предъявляются слушателями, не позволяют просто взять и перенести старые фонограммы на новый цифровой носитель. Кроме того, современная технология позволяет существенно улучшить исходный материал современных записей, исправить многие ошибки звукорежиссера и недостатки акустики самих студий. В этой статье мы рассмотрим арсенал средств современной студии звукозаписи, постараемся выявить плюсы и минусы, которые привнесла в работу со звуком современная цифровая технология, и немного поговорим о проблемах восприятия звука, записанного на цифровом носителе.

Большинство современных компьютеров располагают мультимедийными средствами, позволяя работать со звуком. Но я, увы, должен многих из вас огорчить. Как правило, звуковые адаптеры для компьютеров не удовлетворяют профессиональным стандартам студийного оборудования. Например, нельзя считать пригодными для профессионального ремастеринга и реставрации аудиоплаты, не оснащенные цифровыми интерфейсами ввода/вывода звука типа AES/EBU или, в крайнем случае, S/PDIF. А возможность работы через аналоговые входы/выходы отвергнем сразу - из-за неудовлетворительного качества ЦАП (цифро-аналоговый преобразователь) и АЦП (аналогово-цифровой преобразователь), встроенных в аудиоадаптеры. Таким образом, системы, рассчитанные на работу в составе обычных мультимедийных компьютеров, не подходят для профессионального ремастеринга и реставрации фонограмм, однако позволяют музыканту или звукорежиссеру поэкспериментировать со звуком в домашних условиях. Я имею в виду такие программы, как Sound Forge, Samplitude Studio, DART, и некоторые другие. Те, кто уже знаком с этими системами, наверняка согласятся, что в производственных условиях они вряд ли пригодны по причине весьма медленной работы. Кроме того, оставляет желать лучшего и качество обработки звука этими системами. То же относится и к цифровым фильтрам, и к более сложным алгоритмам - интерполяции, шумопонижения и подавления импульсных помех. Возникают трудности и при обычном монтаже. Подчас в трудной ситуации почти невозможно добиться незаметного на слух монтажа.

Качество конечной фонограммы сильно зависит от выбора АЦП на этапе записи исходного материала. Как вы знаете, стандартной частотой дискретизации для компакт-дисков была выбрана частота 44,1 кГц. Хотя, исходя из известной теоремы Котельникова, эту величина можно признать вполне достаточной, на практике этого явно мало. Представьте, например, что в таком цифровом тракте нужно воспроизвести синусоидальный звук с частотой 20 кГц. Получится, что каждая выборка значения напряжения будет происходить всякий раз в разной ("плывущей") фазе периода сигнала, и в результате мы получим низкую огибающую, которой в исходном сигнале не было. Чтобы избежать этого эффекта, в хороших ЦАП и АЦП применяются схемы оверсэмплинга, а в новый стандарт DVD для звука заложена другая частота дискретизации - 96 кГц. В качестве философского замечания можно добавить, что сам звук (как и восприятие звука) по природе своей носит непрерывный характер, а цифровая технология вносит в него дискретность. Поэтому и прослеживается тенденция увеличения разрядности оцифровки звука и увеличения частоты дискретизации.


Если вы собираетесь заняться реставрацией звука - приготовьтесь отражать многочисленные нападки и серьезные обвинения в ваш адрес, вызванные тем, что далеко не все услышат в вашей фонограмме то, к чему привыкли за много лет или что хотят услышать. Уже, наверное, не осталось людей, которые слышали Федора Шаляпина живьем, но есть много людей, которые заявляют, что знают, как должен звучать его голос. Хотя никто не думает о том, что привык слышать искаженный голос со старых пластинок. Позиция "не трогайте оригинал руками", мне кажется, не совсем верна. Напротив, нужно не стремиться к полному соответствию оригиналу, а выявлять его недостатки и искажения, исправляя их. Конечно, при таком подходе вы можете получить отреставрированный вариант, сильно отличающийся от оригинала. И "знатоки" замашут на вас руками, обругают. А слушатели - поблагодарят и с удовольствием послушают любимых музыкантов и актеров, не заставляя себя абстрагироваться от шумов и помех. И если их число возрастет благодаря вашей работе - это и будет означать, что потрудились вы не зря.