Возможный дубликат:
Распознавание речи - MP3 для отправки текстовых сообщений программному обеспечению
Существует ли часть программного обеспечения, которое позволяет мне указывать на него на, например, mp3 файл подкаста, который это анализирует и создает запись текстового файла аудио?
Существуют немногие программное обеспечение, доступное для выполнения распознавания речи (т.е. речь для отправки текстовых сообщений (STT)), но я не уверен, до какой степени они смогли бы выполнить потребности. Я предполагаю, что доступные лучшие решения являются дорогими. Например, дракон NaturallySpeaking SDK должен смочь сделать задание. Некоторая свободная альтернатива существует все же. Проверьте Сфинкса CMU или Речевое Распознавание программного обеспечения Microsoft, например.
Для сужения исследования необходимо учесть систему, которую Вы используете (Linux, BSD, Windows, и т.д.), а также тип записи этого, Вы будете использовать (динамики, известные заранее или не). Это повлияет на решения, что Вы можете или не можете использовать. Кроме того, остерегайтесь этого, afaik, распознавание речи далеко от того, чтобы быть точным.
Надежда это помогает!