Я использовал SimpleOCR, который имеет хороший GUI для исправления ошибок. К сожалению, это делает много ошибок! (и переносит другие ошибки и ограничения),
С другой стороны, Tesseract более точен, но не имеет никакого GUI вообще.
Мой вопрос, там бесплатная программа OCR для Windows, который имеет хороший GUI и низкий коэффициент ошибок? Я хочу, чтобы это выделило подозрительные слова (неуверенностью OCR, не просто проверив правописание) и показало исходное (растровое) слово, в то время как я редактирую слово OCRed, подобное тому, что делает SimpleOCR.
Открытый исходный код был бы лучшим, сопровождался бы бесплатным программным обеспечением, затем испытал бы / демонстрация / демонстрационное ПО с ограниченными возможностями длинный путь позади.
Вы попробовали gimagereader, gui переднюю сторону для Tesseract?
Существует также TOPOCR (иначе SnapReader), содержа выполняющий последующую обработку Программу проверки правописания для 11 Языков:
SnapReader может использоваться для создания собственных доступных для поиска примечаний почти из любого изображения документов. Или можно использовать его в качестве инструмент разработки и создать собственное доступное для редактирования содержание с помощью сканера или камеры и сохранить результаты как HTML или PDF. SnapReader может также преобразовать текст в очень высококачественное аудио с помощью Audrey. Так не только может Вы использовать свой сканер или камеру для получения документов, можно теперь также использовать портативный аудиоплеер или смартфон, чтобы "считать" их.
Программное обеспечение частично основано на Tesseract, лучшем механизме OCR с открытым исходным кодом, доступном на данный момент. В то время как проект, как ожидают, будет выпущен в конце следующего года и будет использоваться для книги Google, сканируя проект, команда имеет некоторые интересные приложения в виду:
- интерфейс веб-сервиса
- PDF, камера и экран OCR
- интеграция с инструментами поиска по компьютеру: Гончая, Центр внимания, Google Desktop
OCRopus (TM) является современным анализом документа и Системой оптического распознавания, показывая сменный анализ топологии, сменное распознавание символов, статистическое моделирование естественного языка и многоязычные возможности.
Механизм OCRopus основан на двух исследовательских проектах: высокоэффективное устройство распознавания почерка разрабатывается в середине 90-х и развернутое американским Бюро переписи и новыми высокоэффективными методами анализа топологии.
OCRopus является разработкой, спонсируется Google и первоначально предназначается для высокой пропускной способности, усилий по преобразованию документа большого объема. Мы ожидаем, что это также будет превосходная Система оптического распознавания для многих других приложений.Ссылки:
GOCR является OCR (Оптическое распознавание символов) программа, разработанная в соответствии с Лицензией Общественности GNU. Это преобразовывает отсканированные изображения текста назад к текстовым файлам. Шуленбург Joerg запустил программу и теперь приводит команду разработчиков. GOCR может использоваться с различными фронтендами, который делает его очень легким к порту к различным Ose и архитектуре. Это может открыть много различных форматов изображения, и его качество улучшалось в ежедневной основе.
Ссылки: