Недоступный для поиска, uncopiable документ в формате PDF

У меня есть документ в формате PDF, который по некоторым причинам я не могу скопировать и вставить или искать в. PDF является основанным на тексте и не файлом изображения. Когда я пытаюсь скопировать и вставить текст в Microsoft Word или GNU Emacs, я получаю много маленьких полей вместо букв. Когда я пытаюсь искать текст в Adobe Reader, я не могу найти слова, которые я вижу, там. Документ, кажется, не имеет специальной защиты, относился к нему. У меня был PDFs несколько раз прежде. Я пытался открыть его в Google Docs, но снова, хотя это выходит как открытый текст, я не могу искать его. Это звонит в какие-либо звонки с кем-либо?

Я пытался смотреть на шрифты PDF, и он похож на это:

--font-65795-6-- (Embedded Subset)
Type: TrueType
Encoding: Built-in
Century (Embedded Subset)
Type: TrueType
Encoding: Built-in

сопровождаемый подобными строками в течение века, Helvetica, Символа, римлянина времен и Verdana.

3
задан 21.09.2017, 17:41

3 ответа

Этот PDF, вероятно, содержит свой собственный шрифт, который встраивается в него. В этом случае, хотя PDF все еще отобразится правильно, информация о правильном тексте не всегда доступна, и копирование становится невозможным.

Шрифты на самом деле все встраиваются, но способом что вся информация о кодировании была удалена. Это происходит, когда PDF, который все еще синтаксически полностью совместим со спецификацией PDF, имел важную информацию о значении текста в выброшенном во время процесса создания PDF. Очень трудно восстановить информацию о кодировании, и иногда наилучший вариант состоит в том, чтобы преобразовать страницы в TIFF и затем выполнить OCR...

Можно попробовать PDF к Word Converter, такому как AnyBizSoft или преобразователь веб-сайта. После преобразования можно получить то, что Вы хотите от слова или текстового файла. Вот пошаговое учебное руководство для AnyBizSoft. (AnyBizSoft рекомендуют многие, но я никогда не использовал его лично.)

См. также Лучшие Свободные Инструменты PDF для большего количества инструментов и преобразователей.

5
ответ дан 07.12.2019, 22:50

Нет ли случайно странный нестандартный шрифт, используемый в том PDF?

3
ответ дан 07.12.2019, 22:50

Возможно, попробуйте онлайн (или офлайн) инструмент OCR?

0
ответ дан 07.12.2019, 22:50

Теги

Похожие вопросы