Я слушаю ежедневный подкаст, который приблизительно 4 часа длиной. Я думаю, что это был бы прохладный проект, если я мог бы идти с некоторым способом генерировать расшифровки стенограммы его автоматически. Есть ли какое-либо программное обеспечение, которое "послушает" mp3s и создаст текст того, что они говорят?
Я не являюсь очень соответствующим с дифференциацией, кто говорит, потому что я думаю, что это спросило бы слишком много. Существует 4 основных человека, говорящие и другие менее часто.
Вам нужно программное обеспечение для распознавания речи.
Несколько программ существуют для этого, но я не знаю никого, который может сделать пакетное преобразование. Я вполне уверен, это - функция по крайней мере одного из них все же. Обратите внимание, что большинство из них является совсем не дешевым.
Испытанная волна для отправки текстовых сообщений? Это - окна только и имеет ограниченную бесплатную демонстрационную версию.
Сколько речи находится в этих файлах? Все файлы содержат речь от одной (обучаемой) речи? Каково качество звука? Если ответы на эти вопросы не: 'Просто меня', 'Да', и 'Качество CD', @Snark является правильным, необходимо сделать это по существу вручную. Получите хорошую программу распознавания речи, потратьте обучение некоторого времени оно и воспроизведите свои файлы, в то время как Вы пытаетесь сказать, что они говорят.
Ожидайте приблизительно 90%-й - 95% успешную запись, которая звучит великолепно, пока Вы не понимаете, что означает 1, или 2 из каждых 20 слов является неправильным.
Другие факторы, которые могут влиять на точность:
я использую Дракона NaturalSpeaking для записи. превосходное программное обеспечение!
но это не свободно, Amazon предлагает фактическую версию 10 за 45$, если Вы будете озираться, то Вы станете DNS9 еще более дешевый.
Шаги:
Совет
Одна вещь, которую Вы могли попробовать (хотя не ежедневно) загружает аудио как видео к YouTube, затем прося, чтобы YouTube записал видео, дав Вам, английские подписи... могут занять до 24 часов для YouTube, чтобы сделать это, однако... Файл подписи даже загружаем, и можно отредактировать их сами, таким образом, Вы могли скопировать и вставить текст к тому, везде, где Вы хотели...
Проблема с Драконом, Естественно Говорящим в контексте как это, состоит в том, что Вы действительно не смогли бы пройти учебный процесс, где он учится точно интерпретировать речь. Это не предназначается для этого вида использования. Возможно, NSA имеет некоторое программное обеспечение, чтобы сделать этот вид вещи.:)