Невозможно резервирование нелатинские символы с документа в формате PDF

У меня есть файл PDF, который содержит некоторые нелатинские европейские символы. Если я копирую некоторый текст с инструментом выделения и вставляю его в другую программу (слово, блокнот) - 'специальные' символы не передают правильно (я получаю другие нечетные символы в их месте).

Я попытался копировать текст и с Acrobat Reader и с Foxit.

Есть ли что-нибудь, что я могу сделать здесь для копирования этого?

Спасибо

4
задан 07.01.2010, 13:36

2 ответа

Наиболее вероятный ответ - то, что текст в документе в формате PDF не содержит правильные символы. То, что Вы видите, не обязательно, что Вы получаете с PDF, текст, который Вы копируете с и изображение, которое Вы видите, является двумя разными вещами, и во многих случаях что текст является просто чтением OCR изображения, которое, вероятно, не распознает нелатинские символы.

0
ответ дан 07.12.2019, 20:28

Это кажется, что могла быть проблема кодирования. Удостоверьтесь, что оба файла установлены на кодирование Unicode (вероятно, UTF-8). Я не совсем уверен, как сделать это в Acrobat Reader, но Блокнот и Word позволяют Вам устанавливать это.

См. http://www.text-editor.org/encoding.htm для большего количества информации о кодировании.

0
ответ дан 07.12.2019, 20:28

Теги

Похожие вопросы