Я отправил очень похожий вопрос сегодня, но я хотел бы спросить снова с фокусом wget/linux. Я надеюсь все в порядке.
Я должен создать офлайновые копии веб-страниц программно на стеке LAMP, предпочтительно с помощью PHP. Мне нужны источник HTML, присоединенные изображения и таблицы стилей CSS.
Я могу выполнить вещи на командной строке, но не установить новые пакеты.
Я могу сделать a wget --page-requisites
на страницах я хочу заархивировать. Это загружает все, в чем я нуждаюсь, но это не изменяет загруженный HTML и файлы CSS для указания на заархивированные файлы.
Я ищу расширение / сценарий Perl / сценарий оболочки, который изменяет загруженный документ (документы) для указания на загруженные ресурсы или возможно другое, основанное на Linux решение, которое делает это. Я уже проверил, httrack
кажется, не установлен на сервере ("whereis httrack" ничего не, возвращает).
Попробуйте --convert-links
опция:
После того, как загрузка завершена, преобразуйте ссылки в документе для создания их подходящими для локального просмотра. Это влияет не только на видимые гиперссылки, но и любую часть документа, который связывается с внешним содержанием, таким как встроенные изображения, ссылки на таблицы стилей, гиперссылки к несодержимому HTML, и т.д.