[linux] Command-line sound filter

Fragaria

Народ, подскажите, есть ли какие-нибудь консольные (command-line, а не ncurses) тулзы для редактирования звука? Задача в общих чертах состоит в том, чтобы накладывать частотные фильтры на звук для подавления шумов в файле с записью голосового сообщения. На первых порах будет достаточно фильтра, пропускающего только частоты человеческого голоса, безо всяких анализов спектра и прочего, хотя в идеале конечно можно и более сложные тулзы юзать.

procenkotanya

sox

Fragaria

Угу, щаз как раз смотрю на него, а что-нибудь специализированное на выделении голоса и Noise Reduction есть?
Про sox я что-то забыл, хотя уже использую его в паре сервисов

apl13

Блин, я помню, как я тебе его под винду советовал.
Специализированное можно самому написать: basicsynth какой-нибудь или другая синтовая библа (насчет нойз-ре, правда, не знаю, но должна быть наверняка открытая реализация) + libsndfile, или как он там.

Fragaria

Попробовал обрезать частоты - бесполезно: звук пишется в AMR, там и так обрезаны все неголосовые частоты. Убирать шум из голоса - задача та ещё. Попробовал фильтр noiseprof | noisered - шумы из естественного фона улицы стали какими-то компьютерными переливами, и полностью конечно же не исчезли. Так что видимо в автоматическом режиме задача пока неразрешима.

elenangel

в audacity есть какой-то интересный фильтр шумов, который по кусочку шума потом удаляет. оно кончено не консольное, но зато gnu.

Fragaria

Я думаю это как раз то же, что и noiceprof | noisered. Первый по куску шума создаёт профиль (я так понимаю, спектр второй по данному профилю убирает шумы. Очень своеобразный эффект получается, если шумы попадают в те же частоты, что и голос.

apl13

звук пишется в AMR

Мнэ, это, по-моему, максимум того, что тут можно сделать в автоматическом режиме. Ну то есть наложить бандпасс, что и так сделает энкодер.

apl13

Алсо у меня глупый вопрос: у тебя запись-то изначально монофоническая? Расскажи вообще ее параметры.

Fragaria

Да, моно. Мы её получаем в виде одноканального A-law 8kHz (битность щаз не помню). То есть простора для обработки немного

Ivan8209

Мы её получаем в виде одноканального A-law 8kHz (битность щаз не помню).
А что, есть какой-то смысл в не восьмиразрядном 8 кгц звуке?
---
.Я работаю.

apl13

Да легко!

Ivan8209

"Легко" и несколько дорожек Sun Audio в Ogg можно запихнуть,
был бы смысл.
---
"Не надо читать много книг."

apl13

Ну фиг знает. Неужели в природе так мало звуков глубиной более 48 дБ, но с пренебрежимо малым harmonic contentом выше 4 кГц?

apl13

Во вс. сл., мне это кажется немногим удивительней, чем 8bit/over 9000 kHz, а уж это встретить совсем легко.

Ivan8209

Дело не в природе, а в телефонах.
---
"То, с чем мы имеем дело при наблюдении, это не сама природа,
но природа, доступная нашему методу задавать вопросы."

Оставить комментарий