Как извлечь изображение из файла PDF

Я в настоящее время использую читателя PDF Foxit, и я недавно загрузил изображение с Интернета, но это в файле PDF. Как я извлекаю это изображение?

Операционная система является Windows 7.

49
задан 31.08.2011, 09:09

2 ответа

Быстрый путь, если Вы не требуете исходного пиксельного разрешения изображения, состоит в том, чтобы просто нажать кнопки ALT и Print Screen. Затем выберите вставку, где когда-либо Вы хотите изображение.

Другой способ сохранить разрешение состоит в том, чтобы открыть PDF в программе редактирования изображение, такой как Adobe Photoshop и работать с ним там.

4
ответ дан 07.12.2019, 08:30

При загрузке XPDF для Windows (здесь) Вы найдете несколько .exe файлов внутри. Можно выполнить их без "установки". Использовать pdfimages.exe как это:

pdfimages.exe -help

Это отображает экран справки.

pdfimages.exe ^
    -j ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

Это извлекает весь JPEGs как prefix-00N.jpg и все другие изображения как префикс-00N.ppm (Портативный PixMap).

[Редактирование ComFreek: отметьте запаздывающую наклонную черту в целевом пути, который важен, если Вы не хотите извлекать все изображения в его родительский каталог.]-
{Редактирование KurtPfeifle: Я не соглашаюсь с комментарием ComFreek, но предоставляю читателям право тестировать и узнавать различия в самих результатах. Мой исходный параметр, не используя запаздывающую наклонную черту, как ..\prefix снабдит префиксом названия картинки, используемые для извлеченных файлов.}

pdfimages.exe ^
    -j ^
    -f 11 ^
    -l 13 ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

То же как прежде, но предельное извлечение изображений к страницам 11 ('f' = сначала) к 13 ('l' = в последний раз).


Обновление:

В это время я предпочитаю версию Poppler pdfimages - тем более, что это получило эту новую возможность: добавить -list к командной строке, чтобы просто перечислить (не извлекают), изображения, содержавшиеся в PDF, плюс некоторые их свойства. Пример:

pdfimages -list -f 7 -l 8  ct-magazin-14-2012.pdf

  page   num  type   width height color comp bpc  enc interp  object ID
  ---------------------------------------------------------------------
     7     0 image     581   838  rgb     3   8  jpeg   no        39  0
     7     1 image       4     4  rgb     3   8  image  no        40  0
     7     2 image     314   332  rgb     3   8  jpx    no        44  0
     7     3 image     358   430  rgb     3   8  jpx    no        45  0
     7     4 image       4     4  rgb     3   8  image  no        46  0
     7     5 image       4     4  rgb     3   8  image  no        47  0
     7     6 image       4     6  rgb     3   8  image  no        48  0
     7     7 image     596   462  rgb     3   8  jpx    no        49  0
     7     8 image       4     6  rgb     3   8  image  no        50  0
     7     9 image       4     4  rgb     3   8  image  no        51  0
     7    10 image       8    10  rgb     3   8  image  no        41  0
     7    11 image       6     6  rgb     3   8  image  no        42  0
     7    12 image     113    27  rgb     3   8  jpx    no        43  0
     8    13 image     582   839  gray    1   8  jpeg   no      2080  0
     8    14 image     344   364  gray    1   8  jpx    no      2079  0

Отметьте снова: эта версия pdfimages тот от Poppler (тот от XPDF не делает (уже?) поддерживают эту новую функцию), и версия должна быть v0.20.2 или более новый.

71
ответ дан 07.12.2019, 08:30

Вы можете попробовать импортировать PDF в Inkscape , и работать оттуда. Inkscape одновременно откроет только одну страницу, но даст вам полный контроль над содержимым страницы. Вы сможете довольно легко извлекать и манипулировать векторной графикой из PDF.

Однако, если вы хотите извлечь растровые изображения из PDF, я уверен, что pdfimages из XPDF проще (но вы все еще можете попробовать использовать Inkscape после изучения , как извлечь встроенные изображения из SVG файлов ).

.
8
ответ дан 07.12.2019, 08:30

Теги

Похожие вопросы