Я пытаюсь выделить слова в документе PDF. Однако позади слов, там записан большими буквами, "НЕ КОПИРУЮТ" все всюду по документу. Иногда, когда я пытаюсь выделить слова, это - те большие буквы, которые будут выбраны вместо этого. Как я могу выделить слова, которые я хочу вместо тех больших букв в фоновом режиме?
Ваш документ PDF может быть защищен для того, чтобы сделать это uncopiable.. так, чтобы могла быть проблема. Во-вторых, тот текст может быть водяным знаком также..., который может быть удален из программного обеспечения создателя PDF как профессионал Adobe Acrobat или NitroPDF
для удаления ограничений можно использовать сервисы как http://freemypdf.com/..., но ограничение удаления от PDF может быть недопустимым, равно как и предупреждено этим сайтом.. таким образом, это зависит от содержания PDF.
Удачи..
Это было бы хорошо для попытки:
Может быть достаточно начать выделяться от другой точки.
Попытайтесь выделиться от конца прохода вместо начала, или от немного перед текстом, которым Вы интересуетесь.
Кажется, что Вы хотите удалить водяной знак при хранении файла в формате PDF.
Я нашел, что файл в Интернете с тем же "Не копирует" фоновое изображение и, хотя это не мешает Вам выбирать/выделять текст, действительно это может сделать это немного трудным время от времени.
Для не изобретения велосипед, здесь представлены три решения (у Вас все еще есть PDF в конце), и обходное решение (у Вас есть ряд изображений):
То, какой лучше, зависит, вероятно, на количестве файлов, Вы хотите удалить водяной знак из, и является ли это сопряженной потребностью или чем-то, что Вы будете делать день за днем. Если это - просто это однажды, то я предлагаю пробовать решение для Adobe Acrobat, упомянутое в связанном блоге.
Если Вы не можете скопировать, потому что это "шифруется", и полномочия не позволяют Вам, то просто используют программу съемника пароля PDF. Нет никаких простых в использовании свободных, которые я знаю, все же. Даже программы PDF самые с открытым исходным кодом осуществляют ерунду без печати, без копий. (хотя pdftotext не заботится и позволяет Вам вывести PDF для отправки текстовых сообщений).
Для моего собственного использования я изменил источник pdftk для не проверки ограничений. Недавние обновления библиотеки на основе сделанного меня восстановление, которые изменяются, который я еще не нашел время для получения работы, или я отправил бы патч.
Можно использовать свободного читателя PDF, который знает, как извлечь текст:
Средство просмотра PDF-XChange:
Может извлечь текст из страницы/Файла PDF.
Читатель Foxit:
Может преобразовать целый документ в формате PDF в простой текстовый файл.
И эти читатели быстры и просты в использовании.