Содержание PDF - самый быстрый способ сказать, является ли это текст или отсканированная диаграмма?

Используя Adobe Reader 9 I смотрю на документ в формате PDF со страницами и страницами текста.

Я думаю, что это - просканированный графический, а не истинный текст. Я не конкретен знакомый с форматом PDF, но я предполагаю, что он различает истинный довольный текст и графическое содержание (что-то как HTML делает или MSWord).

Acrobat имеет различные инструменты/режимы. Если я выбираю Избранный Инструмент и перетаскиваю мышь через текст, и это просто создает прямоугольник, (а не блок, выделяющий слова) затем, это - графическое право?

Поскольку Вы, возможно, предположили, что я надеюсь, что я неправ, но я просто хочу быть уверенным.

1
задан 21.02.2011, 13:36

3 ответа

Acrobat Reader должен иметь избранный текстовый инструмент, использовать это вместо обычного избранного инструмента. Избранный текстовый инструмент имеет капитал T около каре как в эти два веб-страницы.

Я не использовал Acrobat Reader в возрастах, таким образом, я не могу подтвердить, доступен ли избранный текст все еще в версии 9. Если это не, то попытайтесь использовать обычный избранный инструмент и затем скопируйте. Если можно вставить его в Блокнот или диалоговое окно Выполнения, то это - текст, если можно вставить его в MSPaint, это - диаграмма.

Как альтернатива, Вы могли также использовать другую программу для PDFs. Foxit популярен и имеет свободного читателя точно так же, как Acrobat делает, но я лично использую Google Chrome теперь, потому что он имеет плагин PDF, который работает отлично в в значительной степени любых общих целях чтения PDF, включая выбор и копирование текста (Chrome является большим как читатель PDF, даже если Вы не хотите использовать его в качестве браузера!)

1
ответ дан 17.12.2019, 00:25

Да. Используя избранный инструмент самый легкий способ определить это. Однако иногда Adobe Reader использует OCR, чтобы скопировать текст с изображений как текст, не отобразить.

0
ответ дан 17.12.2019, 00:25

Я ничего не знаю о Adobe Reader, но инструменты PDF, с которыми я знаком (Okular и Evince) имеют опцию показать шрифты для документа. Документ, который не показывает шрифтов, вероятно, сканируется, в то время как тот, который относится по крайней мере к одному шрифту, мог бы иметь реальный текст. Это ни в коем случае не является надежным, но возможно лучше чем ничего?

Если Adobe Rearder не перечисляет шрифты, то, возможно, утилиты, которые идут с Poppler (библиотека позади Okular и Evince) могут помочь?

0
ответ дан 17.12.2019, 00:25

Теги

Похожие вопросы