Как сделать OCR на документе в формате PDF? [дубликат]

Question

Как сделать OCR на документе в формате PDF? [дубликат]

Возможный дубликат:
Как извлечь текст с OCR от PDF на Linux?

У меня есть несколько документов на английском и иврите, в котором я просканировал и преобразовал в формат PDF.

Есть ли некоторая свободная или дешевая утилита, которая может обработать просканированный PDF и сделать OCR, по крайней мере, на английском языке, предпочтительно также на иврите?

Спасибо!

6

hebrew english ocr pdf

задан 3 revs 20.03.2017, 12:17

Ссылка

3 ответа

Я нашел интересную идею, которая позволяет Google сделать всю работу OCR'ing файлы PDF для Вас.

1

ответ дан eleven81 07.12.2019, 16:31

Ссылка

Лично, я использовал бы Ghostview для преобразования их в изображение, затем Tesseract для преобразования их для отправки текстовых сообщений. Это - полностью бесплатное, кросс-платформенное решение с открытым исходным кодом, с которым у меня были очень хорошие результаты при попытке преобразовать простой текст. Я не использую его для составных документов с таблицами и таким, но для простого текста Вы не можете победить цену.

0

ответ дан Dennis 07.12.2019, 16:31

Ссылка

eleven81 · Accepted Answer · 07.12.2019, 16:31

Я нашел список бесплатного программного обеспечения OCR для Windows.

Однако для этих программ нужен вход изображения, не вход PDF. Для этого попробуйте преобразователь PDF-to-JPG.

Как сделать OCR на документе в формате PDF? [дубликат]

3 ответа

Теги

Похожие вопросы