У меня есть несколько PDFs, которые содержат лигатуры в тексте (например, ff
объединен в отдельный символ, ff
).
Существует ли простой способ удалить их при копировании текста с PDF? (т.е. когда я вставляю, я хотел бы ff
вставляться как ff
).
Я копирую много текста от этих PDFs в ответы на Переполнении стека, и я нахожу лигатуры в лучшем случае неприятными (хорошо, я признаю, я действительно придирчив :-P); лигатуры также не обнаруживаются правильно при копировании в другие места (например, если я копирую их в Блокнот, они обнаруживаются как блоки).
Я не могу изменить PDFs.
Я использую и Adobe Acrobat Reader и Читателя Foxit, но я был бы открыт для попытки нового читателя PDF.