Уже обработайте OCR в пакетном режиме для многих файлов PDF (не OCRed)? [закрытый]

Я использую Поиск Google Desktop (я нахожусь на Vista), и не все мои файлы PDF распознаны в моей папке архива. Это нормально как "файлы PDF, которые содержат отсканированные изображения", не индексируются (http://desktop.google.com/support/bin/answer.py?hl=en&answer=90651)

Таким образом, я хотел бы к OCR многие свои файлы PDF, которые уже не являются OCRed. Моя цель: Я даю программе папку, и она ищет один в подпапках файлы PDF, которые должны быть преобразованы в файлы PDF-OCRed.

Примечание: В прошлом, если файл PDF был защищен паролем, я удалил пароль с другим пакетом (оплата) инструмент: verypdf.com "pwdremover" http://www.verypdf.com/pwdremover/

Кто-либо (не слишком много дорогой) идея?

Я уже попробовал: Finereader 6, про на xp в то время, но не было никакого пакетного включенного процессора... paperfile.net Paperfile, который использует http://code.google.com/p/tesseract-ocr/ Tesseract. Но OCR является только PDF для отправки текстовых сообщений, не PDF к PDF! Существует также другой http://code.google.com/p/ocropus/ проекта

Заранее спасибо ;)

9
задан 04.08.2010, 16:44

2 ответа

Adobe Acrobat обработает папку PDFs и как большинство продуктов Adobe существует 30-дневная пробная версия.
Функция расположена в меню 'Document':

Document > OCR Text Regocnition > Recognise text in multiple files using OCR

от того, где можно добавить папку.

В Acrobat X функция доступна следующие:

Tools > Recognize Text > In Multiple Files
3
ответ дан 07.12.2019, 13:26

Попробуйте WatchOCR. Это - пакет программного обеспечения с открытым исходным кодом, который преобразовывает отсканированные изображения в текст доступный для поиска pdfs. Это свободно и с открытым исходным кодом и имеет хороший веб-интерфейс для удаленного администрирования. С правильной конфигурацией это использоваться для создания пакетного сервиса pdf/ocr для всей сети через кого-то доли. К сожалению, это - Linux только. Но Вы могли установить его на старом сервере, и затем Ваша вся организация могла использовать его.

Если Вы хотите сделать, то же онлайн, ничего не устанавливая, пробует PDFCubed.com

0
ответ дан 07.12.2019, 13:26

Теги

Похожие вопросы