Я, ищут или свободное или заплаченный - для (приблизительно 50$/40pounds) ОБРАБАТЫВАЮТ PDF в пакетном режиме к преобразователю HTML для преобразования нескольких файлов PDF сразу.
Потребности смочь обработать векторизованные и растровые изображения в файле, производя обоих как jpegs ссылаемый страницами HTML.
Я попробовал заплаченный iorigsoft - для PDF к HTML - проблемы, которые это, кажется, подвешивает, или просто пойти неактивное, и материал он на самом деле преобразовывает, имеют неработающие ссылки - неправильное имя используется для составляющих глав в качестве HTML.
Также испытанное приложение из intrapdf.com, но это отказывает около начала преобразования, последовательно.
Обновление:
intrapdf работает над моей машиной Windows XP, но не над моей машиной Windows 7. Единственный незначительный сбой с обрамленным индексным HTML содержания - графика на странице не отображается на странице в кадре - но если Вы открываете кадр только на новой вкладке затем, Вы видите их. Это могло бы быть незначительным сбоем браузера в хроме только.
Это решение достаточно хорошо для меня - учитывая, что я уже потратил деньги (я потратил, прежде чем я спросил), но я не могу принять свой собственный ответ, поскольку это не работает над Windows 7.
Посмотревший инструменты с открытым исходным кодом, но они выглядят одинаково хлопьевидными или используют старые версии PDF.
Нужен он в Windows 7 32bit домой.
Мысли?
Мое решение было бы к 2 частям 1), чтобы продолжить использовать IntraPDF PDF для программы JPG (я заплатил за него) (http://www.intrapdf.com/convert_pdf_to_html.htm) на моей Платформе XP (кажется, не работает над Windows 7 Home 32bit, зависает).
Но я соглашаюсь с Вами, @geekosaur, о PDF и HTML, имеющем различные цели поэтому, перевод/преобразование не будет точен (даже с CSS, относился к HTML, возможно) и на самом деле результирующий HTML, который я видел на некоторых страницах, имеет форматирование, которое не является тем же, но это сделает.
Таким образом, 2-я часть решения должна была бы использовать инструмент IrfanView программы бесплатного приложения для преобразования от PDF до JPG, при этом документ в формате PDF был бы рядом изображений JPG, один для каждой страницы документа. Это легко установить, пакеты представления IrfanView преобразование PDF как часть его сменного комплекта, и предпосылка для PDF загружает GhostView, на который IrfanView предоставляет ссылку. Это работает очень хорошо, за исключением того, что во время процесса, UI иногда зависает, но преобразование все еще продолжается.
Для разъяснения на моей цели я хотел документы PDF в несобственническом формате, который предоставит мне больше возможностей для просмотра документов в будущем. PDF довольно повсеместен хотя, но мне нравится, когда мои данные свободны как в не связанный с форматом.
Благодаря другим участникам:
@AffineMesh94464: http://www.iceni.com/gemini-features.htm (не попробовали это, но дали, я уже заплатил за инструмент, который делает это обоснованно, я, вероятно, не надеюсь покупать другой).
@Sathya: http://www.okdosoft.com/okdo-pdf-to-all-converter-professional.htm (Хорошие взгляды, но я получил сообщение об ошибке, что-то как оно хотело компонент Microsoft).
PDF является паршивым форматом ввода для преобразования, таким образом "хлопьевидный" является мелким очень правило. Некоторые файлы могут быть преобразованы относительно легко, но большинство будет иметь проблемы. (Очень кратко: файл PDF является сжатым списком, "переезжают сюда, производят это, перемещаются туда...". Если документ будет содержать что-нибудь кроме простого L-to-R текста — таблицы, изображения, текст RTL, сноски, и т.д. — то преобразование, вероятно, произведет некоторое количество мусора.)
Я проверил бы, имеют ли openoffice/libreoffice флаги командной строки для преобразования.
PDFs сосут, для какого Вы пытаетесь сделать. Существует огромное несоответствие модели Document между тем, как PDF видит страницу и как HTML видит страницу. Будут файлы PDF, которые просто не могут быть преобразованы легко в HTML ничем.
'Близнецы' от пакета Иценов преобразовывают документы в формате PDF в HTML...
http://www.iceni.com/gemini-features.htm
Вывод не на 100% прекрасен, но Вы могли бы найти это приемлемым. И это - хорошая основа для работы от. Если Вы - перфекционист затем, некоторый завершающий этап 'поиск и замена' может обычно сглаживать большинство проблем.
Можно попробовать PDF Okdo к преобразователю HTML