Возможный дубликат:
Как я могу загрузить весь веб-сайт
Три различных блога, которые я прочитал, недавно объявили, что собираются быть прекращенными и удаленными из сети. Хотя заархивированные страницы, вероятно, будут в кэше Google в течение нескольких недель после того, как они пошли, и некоторыми страницами будет в Пути Обратная Машина, я хотел бы заархивировать те сайты к своему жесткому диску для дальнейшего использования.
Что лучший способ состоит в том, чтобы сделать это? Есть ли какое-либо программное обеспечение, которое преобразовывает блог (например, Blogspot) в хронологический PDF?
Я запустил бы с использования WGET для архивации сайтов, как они (в HTML), впоследствии преобразование в PDF просто.
См. http://www.tufat.com/s_html2ps_html2pdf.htm и http://www.gnu.org/software/wget/