Как улучшить звук диктофонной записи. Как улучшить разборчивость записанной речи

Каким бы качественным не был диктофон, практически всегда требуется последующая обработка голоса. На записи могут присутствовать шум или посторонние звуки, громкость голоса может плавать или быть недостаточной, а сам голос бубнить. Поэтому, если вы готовите запись для последующего прослушивания или, например, для озвучивания ролика на ютубе, то обработка голоса крайне желательна.

Рассмотрим быстрый способ, как может быть осуществлена обработка голоса самостоятельно. Основной акцент будет уделен выделению речи на записи. Но даже если цель не только в речи, после прочтения вам не должно составить труда улучшить качество любой записи.

В статье будут рассмотрены следующие моменты:

  • Нормировка уровня громкости
  • Удаление лишних участков записи
  • Удаление шума в записи
  • Эквализация записи
  • Компрессия

Обработку звука лучше производить в наушниках — они позволят расслышать каждую мелочь. Желательно, чтобы это были не китайцы, купленные в переходе за 50 рублей. В идеале стоит использовать , но подойдут и просто нормальные наушники.

Если ваши наушники сломались и нужно срочно их починить, то сделать это можно даже без паяльника. Как? -Читаем в статье:

Альтернативный путь

Если вам не хватает времени или нет желания вникать, то предлагаю отличный сервис — Kwork , которым я и сам регулярно пользуюсь. Это проверенная биржа фриланс-услуг, где за небольшую плату, Вы сможете самостоятельно выбрать профессионального исполнителя для обработки записи или других услуг.

Программа для обработки голоса — Audacity

Обработка голоса это редактирование аудиофайла, поэтому, в первую очередь, нам нужна программа для работы со звуком. В качестве инструмента воздействия послужит бесплатный и свободно скачивающийся аудио редактор Audacity. Он же может может использоваться и как программа для записи голоса с микрофона.

Интерфейс редактора интуитивно понятен и даже методом тыка можно очень быстро натыкать то, что вам нужно. Осталось только узнать, а что собственно нужно .

Обработка голоса

Итак, имеем запись, в каком либо аудио формате. Первым делом открываем ее в Audacity. Можно сделать это кнопочкой Импортировать из меню Файл редактора, но мне как-то привычнее нагло перетащить файл мышкой из папки в окно редактора.

Для демонстраций был взят кусочек записи длительностью чуть более минуты. Такой, чтобы умещался на экране. На нем демонстрация будет нагляднее. При этом ему присущи все недостатки обычных диктофонных записей.


Нормировка уровня громкости

Чтобы повысить качество звука, первым делом необходимо увеличить громкость записи. Для этого двойным щелчком левой кнопки мыши по дорожке (либо комбинацией Ctrl+a ) выделяем ее. Затем открываем вкладку меню Эффекты и выбираем пункт Нормировка сигнала…


После нажатия, откроется меню настройки эффекта:


Стандартные настройки нас вполне устроят. В окошке указывается значение громкости, которое будет у самого громкого пика вашей записи. Нормировка повысит уровень громкости записи, никак больше не влияя на запись.


У всех инструментов редактора Audacity есть кнопка Preview , т.е. Предпросмотр , или скорее Предпрослушивание. При нажатии на нее воспроизводится первые 5 секунд выделенного участка записи с применением эффекта.

Удаляем лишние места и щелчки

Уровень громкости подрос, но как-то не солидно. Виной всему щелчок в самом начале. Можно попросту заглушить его. Для этого приближаем его и выделяем:


Удобно менять масштаб зажимая Ctrl и крутя колесиком мыши, а для перемещения по записи влево-вправо крутя колесиком зажимать Shift .

Я специально захватил на картинке временную шкалу, чтобы показать, что длительность пика около 0.1 секунды . Для того чтобы заглушить выделенное нажимаем в панели инструментов кнопочку (либо комбинацию Ctrl+L ):


Редактор моментально сровняет пик с землей в идеально прямую линию нулевой громкости:


Можно и удалить это кусочек просто нажав на клавиатуре Delete . Но в таком случае выделенная часть дорожки удалится, а общая длительность сократится. Если запись готовится для озвучивания видео на ютубе , удаление посредством Delete может привести к сдвигу дорожки .

Удалив щелчок, повторяем Нормировку сигнала и получаем уже более солидный результат:


В Audacity есть удобная комбинация клавиш Ctrl+R , нажатие которой повторяет последний использованный эффект. При этом эффект повторяется с теми же самыми настройками.

Нормировка сигнала это просто его усиление на одинаковую величину. Усиление подбираемая так, чтобы места с максимальной громкостью довести до указанного значения. При этом усиливается всё — как полезный сигнал так и фоновый шумок.

Пришла пора избавиться от шума

Обработка голоса неминуемо требует удаление шума. Делается это в два этапа. Сначала нужно создать модель шума , для того чтобы программа знала от чего нужно избавляться. Поэтому находим в записи кусочек, где нет полезной информации, а только то, что мы считаем шумом и выделяем этот участок.

Желательно, чтобы он был как можно длиннее, тогда получится более полно удалить шум из записи.


Теперь в меню Эффекты выбираем Подавление шума… Вверху открывшегося окошка видим и нажимаем единственную кнопочку — Создать модель шума .


На этом окошко закроется… Отлично! Модель шума создана. Теперь выделяем всю запись и вновь заходим в меню Эффекты Подавление шума…

Откроется тоже самое окно, но теперь можно перейти к этапу 2 . Настройки по дефолту подойдут для большинства случаев. Хотя с последним ползунком лучше поэкспериментировать. Жмем ОК , повторяем нормировку и любуемся результатом:


Если сравнить с тем как дорожка выглядела до удаления шума, то можно легко заметить, что постоянная составляющая практически полностью исчезла. Все тихие места стали еще тише, практически занулились. Да и на слух это звучит на порядок лучше.

Для большего кругозора стоит отметить что подавление на каждые 6дБ это ослабление в два раза ., а 3дБ это полтора раза . Если Ваша запись очень шумная и в ней присутствуют разные типы шумов в разных частях, то можно повторить процедуру с момента создания модели шума. При этом кусочек который будет выделен как модель шума взять в другом месте записи. А в окошко Подавление шума(дБ) вписать от 3 до 6дБ. Излишнее подавление может внести ‘замыленность ’ в звук. Так же, зачастую, гораздо эффективнее несколько раз подавить шум по 3дБ , создавая модель шума из разных участков записи, чем один раз бухнут 15 дБ .

Выделяем голос на записи — Эквализация

Так как нас интересует именно речь, то можно дополнительно выделить ее при помощи эквалайзера. Переходим Эффекты→Эквалайзер…


Подобная форма эквалайзера возможно подойдет при обработке на скорую руку. Но все очень сильно зависит от того, как и на что производилась запись. Поэтому рекомендую все-же заглянуть в статью про эквализацию.

Компрессия

Обработка голоса всегда включает в себя выравнивание записи по громкости. В принципе можно вручную выделять кусочки и применять к каждому Нормировку. Это достаточно эффективный способ, но весьма долгий. Да и не зря же люди придумали такую полезную штучку, как Компрессор. Им то мы и воспользуемся:-)

Выделяем всю запись и переходим в меню Эффекты => Компрессоры…

Такие настройки должны подойти большинству. Смысл компрессора в том, что тихие моменты он усиливает а громкие ослабляет и тем самым выравнивает громкость. Посмотрим на результат работы компрессора:


Запись явно преобразилась. Начало записи можно сделать еще громче. Выделим отдельно и повторим компрессию либо нормировку — на Ваш вкус.

Экспорт и сохранение

В открывшемся окне следует указать название файла и выбрать его формат . Можно экспортировать запись в любой популярный аудиоформат, с указанием качества. Для большинства случаев подойдет MP3 с постоянным битрейтом 320 Кбит/с.

Если Вы не успели завершить обработку а вам пора бежать по делам, то можно сохранить проект. Для этого служит пункт меню Файл→Сохранить Проект . Сохраненный проект можно открыть в любое время и продолжить работу. Это особенно актуально, если у вас много дорожек.

Вернемся к первоисточнику для сравнения


Как говорится, найдите 10 отличий….

Заключение

Конечно можно продолжить пытать запись. Еще раз удалить шумы, которые могли вылезти после компрессии, произвести еще большую компрессию чтобы еще улучшить качество звука записи…

Но стоит помнить, что излишняя компрессия может сделать звук зажатым и лишить динамики. Однако решение в любом случае остается за вами и вкусами вашего слухового органа)

Если у Вас не получается обработать запись, то вы всегда можете обратиться за помощью на биржу фриланс услуг .

Материал подготовлен исключительно для сайта

Несмотря на всю популярность онлайн-дистрибуции музыки, многие пользователи продолжают слушать любимые треки по старинке – загрузив их на телефон, в плеер или на жесткий диск ПК. Как правило, подавляющее большинство записей распространяются в MP3-формате, среди недостатков которого встречаются огрехи громкости: трек порой звучит слишком тихо. Исправить эту проблему можно, изменив громкость при помощи специального ПО.

Есть несколько способов изменить громкость трека в формате MP3. К первой категории относятся утилиты, написанные именно для такой цели. Ко второй – различные аудиоредакторы. Начнем с первой.

Способ 1: Mp3Gain

Достаточно простое приложение, способное не только изменять уровень громкости записи, но и позволяющее проводить минимальную обработку.


Это решение выглядело бы идеальным, если не учитывать клиппинг – вносимые в трек искажения, вызванные увеличением громкости. С этим ничего не поделать, такая особенность алгоритма обработки.

Способ 2: mp3DirectCut

Простой, бесплатный аудиоредактор mp3DirectCut обладает необходимым минимумом функций, среди которых есть опция усиления громкости песни в MP3.


mp3DirectCut уже сложнее для рядового пользователя, пусть интерфейс программы и дружелюбнее, чем у профессиональных решений.

Способ 3: Audacity

Еще один представитель класса программ для обработки звукозаписей, Audacity , также может решить задачу изменения громкости трека.

  1. Запустите Аудасити. В меню инструментов выберите «Файл» , затем «Открыть…» .

  2. Пользуясь интерфейсом добавления файлов, доберитесь к каталогу с аудиозаписью, которую хотите отредактировать, выберите её и нажмите «Открыть» .

    После непродолжительного процесса загрузки трек появится в программе

  3. Снова используйте верхнюю панель, теперь уже пункт «Эффекты» , в котором выберите «Усиление сигнала» .

  4. Появится окно применения эффекта. Прежде чем приступать к изменению, поставьте галочку в пункте «Разрешить перегрузку сигнала» .


    Это необходимо, поскольку пиковое значение по умолчанию равно 0 дБ, а даже в тихих треках оно выше нуля. Без включения этого пункта вы просто не сможете применить усиление.
  5. Воспользовавшись ползунком, задайте подходящее значение, которое отображается в окошке над рычажком.


    Предварительно прослушать фрагмент записи с измененной громкостью можно, нажав на кнопку «Preview» . Небольшой лайфхак – если изначально в окошке отображалось отрицательное число децибел, двигайте ползунком до тех пор, пока не увидите «0,0» . Это приведет песню к комфортному уровню громкости, а нулевое значение усиления избавит от искажений. Проведя необходимые манипуляции, нажмите «ОК» .
  6. Следующий шаг – опять использовать «Файл» , но на этот раз выбрать «Экспорт аудио…» .

  7. Откроется интерфейс сохранения проектов. Измените по желанию папку назначения и имя файла. Обязательно в выпадающем меню «Тип файлов» выберите «Файлы MP3» .


    Внизу появятся опции формата. Как правило, в них ничего менять не нужно, разве что в пункте «Качество» стоит выбрать «Безумно высокое, 320 Кбит/с» .


    Потом нажмите «Сохранить» .
  8. Появится окно свойств метаданных. Если знаете, что с ними делать – можете подредактировать. Если нет – оставляйте все, как есть, и нажимайте «ОК» .

  9. Когда процесс сохранения будет окончен, отредактированная запись появится в выбранной ранее папке.

Audacity – уже полноценный аудиоредактор, со всеми недостатками программ этого типа: недружелюбный в отношении новичков интерфейс, громоздкость и необходимость установки модулей-плагинов. Правда, компенсируется это небольшим занимаемым объемом и общим быстродействием.

Способ 4: Free Audio Editor

Последний на сегодня представитель ПО для обработки звука. Freemium, но с современным и понятным интерфейсом.


В «Фейсбуке» нам задали вопрос:
«Для работы с текстом мне нужно расшифровать 3 часа диктофонной записи. Пробовал загрузить аудиофайл с картинкой в YouTube и воспользоваться их расшифровщиком текста, но получается какая-то абракадабра. Подскажите, как можно решить это технически? Спасибо!
Александр Коновалов»

Александр, простое техническое решение есть – но результат будет зависеть исключительно от качества вашей записи. Поясню, о каком качестве речь.

За последние годы технологии распознавания русской речи сильно продвинулись вперед. Процент ошибок распознавания снизился до такого уровня, что иной текст стало проще «наговорить» в специальном мобильном приложении или интернет-сервисе, откорректировав вручную отдельные «очепятки» – чем целиком набирать весь текст на клавиатуре.

Но, чтобы искусственный интеллект системы распознавания смог проделать свою работу – пользователь должен проделать свою. А именно: говорить в микрофон четко и размеренно, избегать сильных фоновых шумов, по возможности использовать стереогарнитуру или выносной микрофон, прикрепленный к петлице (для качества распознавания важно, чтобы микрофон все время находился на одном расстоянии от губ, а вы сами говорили с одинаковой громкостью). Естественно, чем выше класс аудиоустройства – тем лучше.

Несложно придерживаться этих условий, если вы, вместо того, чтобы обращаться к интернет-сервису распознавания речи напрямую, применяете в качестве промежуточного устройства-посредника диктофон. К слову, такой «персональный секретарь» особенно незаменим, когда у вас нет доступа к онлайну. Естественно, лучше использовать хотя бы недорогой профессиональный диктофон, нежели записывающее устройство, встроенное в дешевый mp3-плеер или смартфон. Это даст гораздо больше шансов «скормить» полученные записи сервису распознавания речи.

Сложно, но можно уговорить соблюдать эти правила собеседника, у которого вы берете интервью (еще один совет: если у вас нет в комплекте выносного микрофона на прищепке – хотя бы держите диктофон рядом с собеседником, а не с собой).

А вот «законспектировать» на нужном уровне в автоматическом режиме конференцию или семинар – дело, на мой взгляд, практически нереальное (ведь вы не сможете контролировать речь спикеров и реакцию слушателей). Хотя достаточно интересный вариант: превращение в текст профессионально записанных аудиолекций и аудиокниг (если на них не накладывалась фоновая музыка и шумы).

Будем надеяться, что качество вашей диктофонной записи – достаточно высокое, чтобы ее удалось расшифровать в автоматическом режиме .

Если же нет – практически при любом качестве записи вы сможете провести расшифровку в полуавтоматическом режиме .

Кроме того, в ряде ситуаций наибольшую экономию времени и сил вам принесет, как ни парадоксально, расшифровка в ручном режиме . Точнее, тот ее вариант, который сам я использую уже с десяток лет. 🙂

Итак, по порядку.

1. Автоматическое распознавание речи

Многие советуют расшифровывать диктофонные записи на YouTube. Но этот метод заставляет пользователя тратить время на этапе загрузки аудиофайла и фоновой картинки, а затем – в ходе очистки итогового текста от меток времени. Между тем, это время несложно сэкономить. 🙂

Вы можете распознавать аудиозаписи прямо со своего компьютера, воспользовавшись возможностями одного из интернет-сервисов, работающих на движке распознавания Google (рекомендую Speechpad.ru или Speechlogger.com). Все, что нужно – проделать маленький трюк: вместо вашего голоса, воспроизводимого с микрофона, перенаправить на сервис аудиопоток, воспроизводимый вашим компьютерным проигрывателем.

Этот трюк называется программным стерео микшером (его обычно применяют для записи музыки на компьютере или ее трансляции с компьютера в интернет).

Стерео микшер входил в состав Windows XP – но был удален разработчиками из более поздних версий этой операционной системы (говорят, в целях защиты авторских прав: чтобы геймеры не воровали музыку из игр и т.п.). Однако стерео микшер нередко поставляется вместе с драйверами аудиокарт (например, карт Realtec, встраиваемых в материнскую плату). Если вы не найдете стерео микшер на своем ПК с помощью предлагаемых ниже скриншотов – попробуйте переустановить аудиодрайверы с CD-диска, который шел в комплекте с материнской платой – либо с сайта ее производителя.

Если и это не поможет – установите на компьютер альтернативную программу. Например – бесплатный VB-CABLE Virtual Audio Device : использовать его рекомендует владелец вышеупомянутого сервиса Speechpad.ru.

Первым шагом вы должны отключить для использования в режиме записи микрофон и включить вместо него стерео микшер (либо виртуальный VB-CABLE).

Для этого нажмите по иконке громкоговорителя в правом нижнем углу (возле часов) – либо выберите раздел «Звук» в «Панели управления». Во вкладке «Запись» открывшегося окна щелкните правой кнопкой мыши и поставьте птички напротив пунктов «Показать отключенные устройства» и «Показать отсоединенные устройства». Нажмите правой кнопкой по иконке микрофона и выберите пункт «Отключить» (вообще, отключите все устройства, отмеченные зеленым значком).

Нажмите правой кнопкой по иконке стерео микшера и выберите пункт «Включить». На иконке появится зеленый значок, что будет означать, что стерео микшер стал устройством по умолчанию.

Если вы решили использовать VB-CABLE – то тем же способом включите его во вкладке «Запись».

А также – во вкладке «Воспроизведение».

Второй шаг. Включите аудиозапись в любом проигрывателе (если нужно расшифровать аудиодорожку видеоролика – можно запустить и видеопроигрыватель). Параллельно загрузите в браузере Chrome сервис Speechpad.ru и нажмите в нем кнопку «Включить запись». Если запись достаточно высокого качества, вы увидите, как сервис на глазах превращает речь в осмысленный и близкий к оригиналу текст. Правда, без знаков препинания, которые вам придется расставить самостоятельно.

В качестве аудиопроигрывателя советую использовать AIMP, о котором будет подробнее рассказано в третьей подглавке. Сейчас лишь отмечу, что этот плеер позволяет замедлить запись без искажений речи, а также исправить некоторые другие погрешности. Это может несколько улучшить распознавание не слишком качественной записи. (Иногда даже советуют предварительно подвергать плохие записи обработке в профессиональных программах редактирования звука. Однако, на мой взгляд, это слишком трудоемкая задача для большинства пользователей, которые гораздо быстрее наберут текст вручную. 🙂)

2. Полуавтоматическое распознавание речи

Тут все просто. Если запись некачественная и распознавание «захлебывается» либо сервис выдает слишком много ошибок – помогите делу сами, «встроившись» в цепочку: «аудиоплеер – диктор – система распознавания».

Ваша задача: прослушивать в наушниках записанную речь – и параллельно надиктовывать ее через микрофон интернет-сервису распознавания. (Естественно, вам не нужно, как в предыдущем разделе, переключаться в списке записывающих устройств с микрофона на стерео микшер или виртуальный кабель). А в качестве альтернативы упоминавшимся выше интернет-сервисам можете использовать смартфонные приложения вроде бесплатной «Яндекс.Диктовки» либо функцию диктовки в iPhone с операционной системой iOS 8 и выше.

Отмечу, что в полуавтоматическом режиме вы имеете возможность сразу диктовать знаки препинания, расставлять которые в автоматическом режиме сервисы пока не способны.

Если у вас получится диктовать синхронно с воспроизведением записи на плеере – предварительная расшифровка займет практически столько же времени, сколько и сама запись (не считая последующих затрат времени на исправление орфографических и грамматических ошибок). Но даже работа по схеме: «прослушать фразу – надиктовать – прослушать фразу – надиктовать», – может вам дать неплохую экономию времени по сравнению с традиционным набором текста.

В качестве аудиоплеера рекомендую использовать тот же AIMP. Во-первых, с его помощью вы можете замедлить воспроизведение до скорости, на которой вам будет комфортно работать в режиме синхронной диктовки. Во-вторых, этот плеер умеет возвращать запись на заданное количество секунд: это бывает необходимо, чтобы лучше расслышать неразборчивую фразу.

3. Расшифровка диктофонной записи в ручном режиме

Вы можете установить на практике, что слишком быстро устаете от диктовки в полуавтоматическом режиме. Или делаете вместе с сервисом слишком много ошибок. Или, благодаря навыкам быстрого набора, гораздо легче создаете готовый исправленный текст на клавиатуре, чем с помощью диктовки. Или ваш диктофон, микрофон на стереогарнитуре, аудиокарта не обеспечивают приемлемое для сервиса качество звука. А может, у вас просто нет возможности диктовать вслух в своем рабочем или домашнем офисе.

Во всех этих случаях вам поможет мой фирменный способ расшифровки вручную (прослушиваете запись в AIMP – набираете текст в Word). С его помощью вы превратите запись в текст быстрее, чем это сделают многие профессиональные журналисты, чья скорость набора на клавиатуре аналогична вашей! При этом вы потратите гораздо меньше, чем они, сил и нервов. 🙂

Из-за чего, в основном, теряются силы и время в ходе расшифровки аудиозаписей традиционным способом? Из-за того, что пользователь совершает очень много лишних движений.

Пользователь постоянно протягивает руку то к диктофону, то к клавиатуре компьютера. Остановил воспроизведение – набрал прослушанный отрывок в текстовом редакторе – снова включил воспроизведение – отмотал неразборчивую запись назад – и т.д., и т.п.

Использование обычного программного плеера на компьютере мало облегчает процесс: пользователю приходится постоянно сворачивать/разворачивать Word, останавливать/запускать плеер, да еще елозить туда-сюда слайдером плеера, чтобы найти неразборчивый фрагмент, а затем вернуться к последнему прослушанному месту в записи.

Чтобы сократить эти и другие потери времени, специализированные IT-компании разрабатывают программные и аппаратные транскрайберы. Это достаточно дорогие решения для профессионалов – тех же журналистов, судебных стенографистов, следователей и т.д. Но, собственно, для наших целей требуются только две функции:

  • возможность замедлить воспроизведение диктофонной записи без ее искажения и понижения тона (замедлить скорость воспроизведения позволяют многие плееры – но, увы, при этом человеческий голос превращается в монструозный голос робота, который сложно воспринимать на слух продолжительное время);
  • возможность остановить запись или откатить ее на заданное количество секунд и вернуть обратно, не останавливая набор текста и не сворачивая окно текстового редактора.

В свое время я протестировал десятки аудиопрограмм – и нашел лишь два доступных платных приложения, отвечающих этим требованиям. Приобрел одно из них. Поискал еще немного для своих дорогих читателей 🙂 – и нашел замечательное бесплатное решение – проигрыватель AIMP , которым сам пользуюсь до сих пор.

«Войдя в настройки AIMP, найдите раздел Глобальные клавиши и перенастройте Стоп/Пуск на клавишу Эскейп (Esc). Поверьте, это наиболее удобно, поскольку не придется задумываться и палец не попадет случайно на другие клавиши. Пункты «Немного перейти назад» и «Немного перейти вперед» настройте, соответственно, на клавиши Ctrl + клавиши курсора назад/вперед (у вас на клавиатуре есть четыре клавиши со стрелками – выберите две из них). Эта функция нужна, чтобы заново прослушать последний фрагмент или перейти немного вперед.

Затем, вызвав эквалайзер, вы можете уменьшить значения «Скорость» и «Темп» – и увеличить значение «Питч». При этом Вы заметите, что скорость воспроизведения замедлится, но высота голоса (если хорошо подберете значение «Питч») – не изменится. Подберите эти два параметра так, чтобы вы практически синхронно успевали набирать текст, лишь изредка останавливая его.

Когда все будет настроено, набор будет занимать у вас меньше времени, и руки будут уставать меньше. Вы сможете расшифровывать аудиозапись спокойно и комфортно, практически не отрывая пальцев от набора текста на клавиатуре».

Могу только добавить к сказанному, что, если запись не очень качественная – вы можете попытаться улучшить ее воспроизведение, экспериментируя с другими настройками в «Менеджере звуковых эффектов» AIMP.

А количество секунд, на которое вам будет наиболее удобно перемещаться по записи назад или вперед с помощью горячих клавиш – установите в разделе «Плеер» окна «Настройки» (которое можно вызвать нажатием горячих клавиш «Ctrl + P»).

Желаю сэкономить побольше времени на рутинных задачах – и плодотворно использовать его для главных дел! 🙂 И не забудьте включить микрофон в списке записывающих устройств, когда соберетесь поговорить по скайпу! 😉

3 способа расшифровки диктофонной записи: распознавание речи, диктовка, ручной режим

Я часто записываю информацию на диктофон. Но в результате получается звук очень тихий и с шумами. Необходимо улучшить качество сделанных записей. Для этого я буду использовать Adobe Audition CS5.5.



0. Получение файла

После того как была произведена запись, файл необходимо скопировать на компьютер. Обычно для этого используются специализированные программы, входящие в комплект поставки диктофона или телефона.

1. Загрузка файла

Меню"File" > "Open..." и появившемся окне выбираем обрабатываемый файл.




Отмечу, что Adobe Audition поддерживает большое количество форматов звуковых файлов.

2. Перевод в mono (если необходимо)

Некоторые платы захватывают монозвук только в стереорежиме Stereo. Во-первых, эта лишняя трата места (каналы дублируются). Во-вторых, обрабатывать два раза одно и то же (для каждого канала) нет смысла. Поэтому такие записи необходимо перевести в моно.



Стереозапись

Для этого нужно:



  • Выбрать "Edit" > "Extract Channels to Mono Files", а затем сохранить одну из двух полученных дорожек в файл.
  • Выбрать "Edit" > "Convert Sample Type", а затем изменить параметр Channels на mono. Можно также изменить частоту на 48 000 Гц (качество эта процедура не улучшит, но сделает запись совместимой с форматом DVD).



Таким образом, получаем монозапись:



Монозапись

3. Обработка звука с 32-битным разрешением



Настоятельно рекомендуется проводить обработку звука в разрешении большем, чем разрешение конечного результата - это позволит повысить точность выполнения всех промежуточных преобразований и положительно скажется на качестве звука.

Если для исходного материала и результата используется 16 бит, то рекомендуется все промежуточные операции проводить с разрешением 32 бита. Для этого перед началом обработки звука нужно преобразовать его в формат 32 бита, а по окончании обработки - обратно в 16 бит. Если исходный материал и результат по 32 бита, то увеличить разрешение не получится (32 бита - максимум).

Сделать это можно при помощи "Edit" > "Convert Sample Type", частоту дискретизации (Sample Rate) и каналы (Channels) оставляем такими же (Same as Source), а для разрядности (Bit Depth) выбираем 32 или 16 бит, соответственно.




4. Удаление постоянной составляющей


Следующий этап - удаление постоянной составляющей. Часто при записи звука аппаратура добавляет в звуковой выход некоторую постоянную составляющую. Данное явление приводит к тому, что после записи "синусоида" оцифрованного звука смещена вверх или вниз от центра - нулевого уровня, что может создать сложности при дальнейшей обработке звука.
Чтобы убрать постоянную составляющую в звуковом файле, используется функция"Effects" > "Amplitude and Compression" > "Normalize (process)", выставите DC Bias Adjust 0.0%:



5. Удаление фонового шума



Наиболее важный этап, на мой взгляд, удаление фонового шума. Удаление шума состоит из двух подэтапов. Сначала нужно найти часть записи, в которой нет никаких звуков - только шум. Как правило, такие участки есть перед началом записи или в самом её конце, можно также использовать паузу посреди записи. Чем длиннее такой фрагмент, тем лучше можно определить профиль шума. Поэтому в конце записи я на пару минут оставляю диктофон в помещение, где производилась сама запись.

Открываем форму обработки шума: "Effects" > "Noise Reduction / Restoration" > "Noise Reduction (process)". В ней делаем следующие действия:



  • Жмём "Capture Noise Print", тем самым захватывая профиль шума. После этого в окне отобразится график шума.
  • Воспроизводим файл, нажимая "Select Entire File" и "Play". Пока звучит запись мы на лету можем регулировать шумоподавление.
  • Регулировка шумоподавления осуществляется передвижением точек синей линии. Двигая их вверх-вниз необходимо добиться наилучшего звучания записи без шума.
  • Как только найден подходящий фильтр, его можно и нужно сохранить в файл. Во-первых, это позволяет избежать повторной настройки. Во-вторых, в новых записях возможно не будет фрагмента, который содержат только шум.
  • На последнем шаге необходимо применить фильтр ко всему файлу, нажав кнопку "Apply". Если требуется применить фильтр только к определённой части записи, то из окна "Effect - Noise Reduction" можно переключится в основное окно и выделить необходимый фрагмент.




Нужно быть внимательным при выборе части звукового файла, в которой только шум и нет никаких звуков. Дело в том, что если в этом фрагменте окажется какой-то звук, то Adobe Audition будет удалять все похожие звуки по всей записи. Это приведет к появлению неприятных "металлических" призвуков, особенно заметных на музыкальных фрагментах. Также вы можете судить о наличии таких звуков в вашем фрагменте по изломам и всплескам на спектре шума в окне Noise reduction. Обычно график спектра шума представляет собой плавно меняющуюся линию без резких изломов, возможно, с одним или несколькими всплесками в области высоких частот (справа) (в области высоких частот шумы в звуковом тракте видеотехники особо велики: свист и шипение). Если в результате удаления шума возникли такие призвуки, попробуйте отменить операцию ("Edit" > "Undo noise reduction") и повторить всё с самого начала, начиная с выделения фрагмента звука с шумом. Образец шума и очищаемый от шума звуковой фрагмент могут храниться в разных файлах, эти файлы могут иметь разную разрядность: необходимо только чтобы у этих файлов была одинаковая частота дискретизации и количество каналов.

Функция подавления шума в Adobe Audition является универсальной и позволяет с легкостью удалять почти любые шумы. В результате файл, очищенный от шумов, звучит значительно лучше.

6. Удаление ненужных фрагментов

Понятно, что некоторые фрагменты записи будут просто не нужны. Их следует удалить.

7. Удаление пауз

Всем привет! Нормализация звука не проблема для того, кто умеет пользоваться Audacity даже на самом начальном уровне.

Начнем с определения.

Нормализовать звук — это, по простому говоря, так обработать его в аудиоредакторе, чтобы было приятно слушать, а именно:

  • убрать фоновые шумы,
  • выровнять громкость речи на протяжении всей звуковой дорожки,
  • убрать резкие выбросы/пики громкости,
  • убрать нежелательные звуки (кашель, например),
  • сделать громкость записи такой, чтобы ее можно было комфортно слушать на всех типах компьютеров и мобильных устройств, выставляя громкость устройства на средний уровень.

Насколько это важно? Очень важно! Хорошее видео с плохим звуком – деньги на ветер. Видео «рулит» в интернет-маркетинге. Продаете ли вы через свой интернет-магазин, продвигаете ли свои услуги через сеть, строите ли корпоративный сайт, стремитесь раскачать свой канал в Youtube - везде нужно уметь сделать приличное видео. Но видео-то видео, а если у вас звуковое сопровождение будет тихое, глухое, с шумами, другими дефектами, то считайте, что вся работа насмарку. Никто такое видео далее 10 секунд не станет продолжать смотреть.

Сразу скажу, что если вы уповаете на свою суперсовременную дорогую профессиональную видеокамеру, то это напрасно. Шумы-то она запишет даже лучше чем смартфон. Так что на 100% «вытянуть» звук первоклассным «железом» не получится.

Профессионалы пользуются для этого звуковыми редакторами. Берут отдельно аудиодорожку и правят ее. В этом посте я научу вас, как пользоваться Audacity для нормализации звука.

Почему именно Audacity? Потому, что это:

  1. Специализированная программа – аудиоредактор звуковых файлов.
  2. Достаточно мощная для того, чтобы сделать со звуком что угодно.
  3. Бесплатная.
  4. Достаточно простая в освоении. Особенно когда дело касается стандартных не сложных операций со звуком.

Ну, давайте начнем.

Из этой статьи вы узнаете:


Для того, чтобы все было максимально приближенно к реальной жизни и понятно, возьмем видеозапись, сделанную на самый обычный смартфон – htc one v. Видео он снимает разрешением HD. На сегодня это уже не нечто запредельное, а стандарт. Звук захватывает как смартфон – если близко, то хорошо, если на расстоянии, то уже посредственно.
Итак, наша самая первая задача:

Как извлечь звук из видео в отдельный звуковой файл

Способов — масса. Чтобы не загромождать пост второстепенными подробностями, вкратце расскажу всего про три. Выберете удобный для себя.

  1. Посредством бесплатной программы Freemake Video Converter
  2. Посредством платной программы Total Video Converter
  3. Посредством имеющего у вас видеоредактора. А иметься он у вас должен. Особенно если весь или часть вашего бизнеса — в интернете. Особенно если вы регулярно снимаете и выкладываете видео на ваш сайт. Конечно если вы хотите выкладывать хорошее видео, чтобы его смотрели много людей.

Первые два пункта подробно объяснять не стоит. Там все совершенно несложно, но если будут проблемы – пишите, объясню.

Вот на видеоредакторе остановлюсь поподробнее. В смысле как извлечь звук из видео с его помощью. Видеоредакторов тоже очень много. Я пользуюсь одним из самых популярных – Sony Vegas.

Копируем отснятое видео из смартфона на компьютер.

Открываем видеоредактор.

Через меню Файл – Открыть открываем видеофайл.

и выбираем формат сохраняемого файла mp3. Нажимаем на Custom…

и выбираем параметры сохранения. Рекомендую выбрать Моно, битрейт 128 kbps и частоту 44 100 Hz.

Выбираем папку сохранения и желаемое имя сохраняемого mp3 файла.

Все аудиодорожку мы отдельно сохранили и теперь начнем нормализовать звук . Я распишу все пошагово.

Шаг 1. Первичное применение плагина Hard Limiter

На записанном звуке могут оказаться пики-выбросы по громкости. Если их не уменьшить, то они здорово раздражают или могут даже оглушать. Это может быть и кашель, и внезапно громко передвинутый стул, сигнал рядом проезжающей машины и так далее. Поэтому:

Кликаем по области управления свойствами дорожки левой кнопкой мышки и тем самым выделяем всю дорожку

Затем идем в меню Эффекты-Hard Limiter… и ставим вот такие параметры

Кликаем ОК. Готово.

Шаг 2. Нормализация звука

Обычно запись с микрофонов, смартфонов, диктофонов получается тихой для того, чтобы ее прямо вот в таком виде выложить в виде видео на ютюбе. Значит нам нужно поднять громкость звука. Но желательно сделать это так, чтобы звук был поднялся, но не выше заданного предела. Для этого применяется плагин Нормировка сигнала. Он увеличивает громкость, но так, что максимальная амплитуда – фиксированная. Для этого идем в меню Эффекты-Нормировка сигнала… Ставим в окошке -3.0 db.

Жмем ОК. Смотрим результат.

Шаг 3. Обработка аудиофайла плагином Компрессор…

Продолжаем пользоваться Audacity для нормализации звука и на этом шаге освоим плагин Компрессор… Обращаю ваше внимание, что обрабатывать дорожку нужно именно в таком порядке пошагово, не путая и не перескакивая. Для чего нужен Компрессор…? Компрессор усредняет, уменьшает разницу между самыми тихими и самыми громкими участками. Бывает, человек говорит в микрофон то громче, то тише и при слишком большой разнице слушать такую запись некомфортно. После обработки компрессором, громкость голоса становится более ровной, без скачков.

Итак идем в Эффекты-Компрессор… Ставим вот такие же параметры

и жмем ОК. Радуемся результату.

Шаг 4. Финишная обработка плагином Hard Limiter…

Как бы хорошо ни обрабатывал звук Компрессор, у его алгоритма тоже есть недостатки и при определенных условиях он снова выделяет пики. Чтобы избежать этого, еще раз обработайте дорожку плагином Hard Limiter…, только ставьте уровень не -10, как в первый раз, а -2.0 db.

Вот вобщем и всё. В большинстве случаев этих 4 шагов достаточно. Теперь рассмотрим более сложные случаи, а именно:

  1. если предыдущие плагины – Нормировка сигнала… и Компрессор… — не совсем хорошо справились с нормализацией громкости по всей длине аудиодорожки
  2. и если запись шла при высоком уровне фоновых шумов – рядом работал холодильник, шумел вентилятор, какое-нибудь гудение и тому подобное.

Ручное выравнивание громкости отдельных участков аудиодорожки

Для этого применим простой плагин Усиление сигнала. Он действует как ручка громкости. На этом этапе применение его оправдано, так как звук уже прогнан через Нормировку сигнала… и Компрессор… и в целом представляет собой выровненную без скачков диаграмму. Только, как видите она глобально разная на больших участках. С таким «раскладом» предыдущие плагины не всегда хорошо справляются и поэтому вот сейчас исправим это руками. Замечу, что такая ситуация бывает нечасто.

Итак, выделяем ту часть звуковой дорожки, где уровень сигнала явно ниже. Идем в меню Эффекты-Усиление сигнала… и подбором уровня усиления добиваемся выравнивания фрагментов аудиодорожки по громкости. Посмотрите на видео, как это происходит.

Как убрать шум из записи

Обратите внимание, что сейчас я буду объяснять как бороться именно с непрерывным фоновым шумом. Если вдруг во время непосредственно записи кто-то кашлянул, чихнул, что-то упало – это все не фоновый шум и если есть желание его убрать, то делать это нужно другими способами. А сейчас мы будем убирать именно фоновый шум. Итак, чтобы убрать шум из аудио, нужно найти на аудиодорожке участок тишины, выделить его и внимательно прослушать. Желательно, чтобы он содержал только ровный фоновый шум, без щелчков и других «выпадающих» или выделяющихся кусочков. Чем лучше мы подберем такой фрагмент, тем качественнее программа справится с зачисткой всей аудиодорожки.

Для этого визуально выбираем на диаграмме участок с нулевой или около того амплитудой и выделяем его мышью. Кликаем на кнопку Play в панели кнопок Audacity и внимательно слушаем. Если на фоновом шуме есть другие единичные звуки, то стараемся найти и выделить фрагмент без них.

Найдя наилучший фрагмент, выделяем его. Идем в меню Эффекты-Удаление шума-Создать модель шума.

Затем выделяем всю дорожку. Идем в меню Эффекты-Удаление шума. Оставляем вот эти параметры

Единственный параметр, с которым можно поэкспериментировать, это Подавление шума. Самое первое поле. Советую оставаться в пределах 12-24 db. Если сделать ниже 12, то шум может снизиться совсем незначительно. Если сделать выше 24, то могут появиться искажения на оставшихся участках со звуком.
Смотрим видео, где я все это делаю:


Вот и всё. Аудиодорожка нормализована, осталось сохранить ее в виде файла.

Сохранение обработанной Audacity дорожки в отдельный аудиофайл

Делается это через меню Файл-Экспортировать… Обращаю ваше внимание, что через меню Файл-Сохранить проект… вы сохраните аудиозапись именно в формате Audacity и только. Для того, чтобы сохранить в формате mp3 или wav нужно пользоваться именно Экспортировать… Далее все просто. Выбираете желаемый тип файла. Если необходимо – кликаете Параметры… и задаете нужные параметры. Например, если вы делаете экспорт в mp3, то вы сможете выбрать через Параметры качество звука. Рекомендую не делать его ниже 80 кбит/с и выше 128 кбит/с. Это для голоса, конечно. Если вы писали музыку и вам необходимо максимальное качество звучание, то можете поставить даже 320 кбит/с. Имейте только в виду, что чем выше битрейд (это качество звука), тем большего размера будет получаться итоговый файл.

Итак, из этого поста вы узнали как пользоваться Audacity в части нормализации звука.

Дополнено в декабре 2018 г. — Эта статья написана в 2014 году. За прошедшие 5 лет, к концу 2018го, накопился опыт, выявились тонкости и приемы, которые:

  1. упрощают процедуру,
  2. уменьшают время на обработку звука и
  3. заметно улучшают качество итогового звука
P.S. Хотите получать уведомления о новых статьях этого блога? Нажмите на эту кнопку -

 

Пожалуйста, поделитесь этим материалом в социальных сетях, если он оказался полезен!