Методы для анализа речевых записей, расширяющихся 10 + часы?

У меня есть ситуация, где у меня есть большой mp3 файл, который является выводом регистрирующего устройства журналиста, этим устройством поддерживают в рабочем состоянии в течение долгого времени, поскольку я забываю нажимать кнопки записи, говоря с людьми в сайте, куда я иду для получения сообщений об инцидентах и т.д.

так в основном у меня есть 11-часовой mp3 файл, и в настоящее время я анализирую его для нахождения записей, которые я сделал. Это занимает несколько часов 4-5 часов некоторое время.

Так есть ли путь..
1. Получить одни только речевые записи из этого файла
2. Устраните или уменьшите объем трафика / или другие фоновые шумы как звуки машины и т.д. так, чтобы только речевые звуки были извлечены из mp3.

Не уверенный, если это возможно

Спасибо

1
задан 27.04.2011, 17:09

1 ответ

Быть ясным с начала на: Это - очень сложная задача автоматически проанализировать аудиозаписи. Попытка дифференцироваться между речью и шумом теоретически возможна, но я сомневаюсь, что существует решение с одним щелчком, доступное в Интернете. Это больше походит на исследовательскую работу.

Кроме того, Ваша запись не будет, вероятно, иметь проходов полной тишины. Если бы это было так, то можно было бы разделить файл в точках, где нет абсолютно никакого звука - это включает некоторое программирование также, я не могу вспомнить программу, которая делает это.

Нахождение значительных частей или расстается с речью

Вы могли бы хотеть использовать (свободный, межплатформенный) программа как Смелость для наблюдения Формы сигнала MP3. Используя Форму сигнала Вы видите, где "большая часть" действия.

enter image description here

Например, коричневатые разделы, которые я отметил, являются теми, которые превышают определенный порог. Они наиболее вероятны те с речевой информацией, которую Вы пытаетесь найти.

Другие (синие) части не могли бы содержать релевантную информацию или речь, поскольку они не являются столь же громкими как другие.

Также посмотрите промежуточные разрывы - они помогут Вам определить части, где действительно ничто не продолжается. Вы могли сократить файл там и разделить его для получения различных "интервью" (или независимо от того, что Вы записывали).

Устранение шумов

Для устранения шума можно попытаться использовать эффект Эквалайзера и отфильтровать определенные частоты. Необходимо будет экспериментировать с этим, как не, каждое регистрирующее устройство является тем же и шумовым изменением условий.

Это сказанное можно попытаться повысить частоты между 500 Гц и 1 кГц (или сгладить к 4 кГц), и сократить частоты ниже 500 Гц и выше 8 кГц.

Смелость также имеет определенные фильтры устранения шумов для удаления статичный, шипение, гул или другие постоянные фоновые шумы. Эксперимент с теми.

2
ответ дан 12.12.2019, 12:54

Теги

Похожие вопросы