PDF к HTML - обрабатывает преобразователь в пакетном режиме - самый надежный и точный свободный И оплаченный программное обеспечение?

Я, ищут или свободное или заплаченный - для (приблизительно 50$/40pounds) ОБРАБАТЫВАЮТ PDF в пакетном режиме к преобразователю HTML для преобразования нескольких файлов PDF сразу.

Потребности смочь обработать векторизованные и растровые изображения в файле, производя обоих как jpegs ссылаемый страницами HTML.

Я попробовал заплаченный iorigsoft - для PDF к HTML - проблемы, которые это, кажется, подвешивает, или просто пойти неактивное, и материал он на самом деле преобразовывает, имеют неработающие ссылки - неправильное имя используется для составляющих глав в качестве HTML.

Также испытанное приложение из intrapdf.com, но это отказывает около начала преобразования, последовательно.

Обновление:

intrapdf работает над моей машиной Windows XP, но не над моей машиной Windows 7. Единственный незначительный сбой с обрамленным индексным HTML содержания - графика на странице не отображается на странице в кадре - но если Вы открываете кадр только на новой вкладке затем, Вы видите их. Это могло бы быть незначительным сбоем браузера в хроме только.

Это решение достаточно хорошо для меня - учитывая, что я уже потратил деньги (я потратил, прежде чем я спросил), но я не могу принять свой собственный ответ, поскольку это не работает над Windows 7.

Посмотревший инструменты с открытым исходным кодом, но они выглядят одинаково хлопьевидными или используют старые версии PDF.

Нужен он в Windows 7 32bit домой.

Мысли?

3
задан 08.03.2011, 22:57

5 ответов

Мое решение было бы к 2 частям 1), чтобы продолжить использовать IntraPDF PDF для программы JPG (я заплатил за него) (http://www.intrapdf.com/convert_pdf_to_html.htm) на моей Платформе XP (кажется, не работает над Windows 7 Home 32bit, зависает).

Но я соглашаюсь с Вами, @geekosaur, о PDF и HTML, имеющем различные цели поэтому, перевод/преобразование не будет точен (даже с CSS, относился к HTML, возможно) и на самом деле результирующий HTML, который я видел на некоторых страницах, имеет форматирование, которое не является тем же, но это сделает.

Таким образом, 2-я часть решения должна была бы использовать инструмент IrfanView программы бесплатного приложения для преобразования от PDF до JPG, при этом документ в формате PDF был бы рядом изображений JPG, один для каждой страницы документа. Это легко установить, пакеты представления IrfanView преобразование PDF как часть его сменного комплекта, и предпосылка для PDF загружает GhostView, на который IrfanView предоставляет ссылку. Это работает очень хорошо, за исключением того, что во время процесса, UI иногда зависает, но преобразование все еще продолжается.

http://en.irfanview-forum.de/vb/showthread.php?7689-Irfanview-freezes-during-PDF-to-JPG-conversion-if-you-try-to-continue-with-other-prog

Для разъяснения на моей цели я хотел документы PDF в несобственническом формате, который предоставит мне больше возможностей для просмотра документов в будущем. PDF довольно повсеместен хотя, но мне нравится, когда мои данные свободны как в не связанный с форматом.

Благодаря другим участникам:

  • @AffineMesh94464: http://www.iceni.com/gemini-features.htm (не попробовали это, но дали, я уже заплатил за инструмент, который делает это обоснованно, я, вероятно, не надеюсь покупать другой).

  • @Sathya: http://www.okdosoft.com/okdo-pdf-to-all-converter-professional.htm (Хорошие взгляды, но я получил сообщение об ошибке, что-то как оно хотело компонент Microsoft).

0
ответ дан 07.12.2019, 22:54

PDF является паршивым форматом ввода для преобразования, таким образом "хлопьевидный" является мелким очень правило. Некоторые файлы могут быть преобразованы относительно легко, но большинство будет иметь проблемы. (Очень кратко: файл PDF является сжатым списком, "переезжают сюда, производят это, перемещаются туда...". Если документ будет содержать что-нибудь кроме простого L-to-R текста — таблицы, изображения, текст RTL, сноски, и т.д. — то преобразование, вероятно, произведет некоторое количество мусора.)

5
ответ дан 07.12.2019, 22:54

Я проверил бы, имеют ли openoffice/libreoffice флаги командной строки для преобразования.

PDFs сосут, для какого Вы пытаетесь сделать. Существует огромное несоответствие модели Document между тем, как PDF видит страницу и как HTML видит страницу. Будут файлы PDF, которые просто не могут быть преобразованы легко в HTML ничем.

2
ответ дан 07.12.2019, 22:54

'Близнецы' от пакета Иценов преобразовывают документы в формате PDF в HTML...

http://www.iceni.com/gemini-features.htm

Вывод не на 100% прекрасен, но Вы могли бы найти это приемлемым. И это - хорошая основа для работы от. Если Вы - перфекционист затем, некоторый завершающий этап 'поиск и замена' может обычно сглаживать большинство проблем.

2
ответ дан 07.12.2019, 22:54

Можно попробовать PDF Okdo к преобразователю HTML

1
ответ дан 07.12.2019, 22:54

Теги

Похожие вопросы