У меня есть файл PDF, который содержит некоторые нелатинские европейские символы. Если я копирую некоторый текст с инструментом выделения и вставляю его в другую программу (слово, блокнот) - 'специальные' символы не передают правильно (я получаю другие нечетные символы в их месте).
Я попытался копировать текст и с Acrobat Reader и с Foxit.
Есть ли что-нибудь, что я могу сделать здесь для копирования этого?
Спасибо
Наиболее вероятный ответ - то, что текст в документе в формате PDF не содержит правильные символы. То, что Вы видите, не обязательно, что Вы получаете с PDF, текст, который Вы копируете с и изображение, которое Вы видите, является двумя разными вещами, и во многих случаях что текст является просто чтением OCR изображения, которое, вероятно, не распознает нелатинские символы.
Это кажется, что могла быть проблема кодирования. Удостоверьтесь, что оба файла установлены на кодирование Unicode (вероятно, UTF-8). Я не совсем уверен, как сделать это в Acrobat Reader, но Блокнот и Word позволяют Вам устанавливать это.
См. http://www.text-editor.org/encoding.htm для большего количества информации о кодировании.