Я хочу создать локальное резервное копирование своего блога Блоггера включая локальные копии всех изображений и видео. Каждый раз, когда я отправляю новый блог, я хотел бы зеркально отраженный локально в течение 24 часов. Wget - зеркально отражают в задании крона, хорошее начало, но довольно медленный.
Кто-либо сделал это, или все доверяют Google резервные копии?
Я просто использую wget на ночной основе. FWIW, вот параметры, которые я использую:
- N - включают добавление метки времени
- r - рекурсивный
- k - преобразовывают ссылки
- nv - Выключают подробный вход
- o - выходной журнал
- я - входной файл сайтов для проверки
- m - зеркало
- w1 - ожидают 1 секунда между запросами
- случайный - ожидают - используют случайные времена ожидания между запросами
- np - никакой родитель, никогда не возрастайте к родительскому каталогу
- p - загружают все предпосылки страницы (таблицы стилей, сценарии, и т.д.)
- X - каталоги для исключения
- R - имена файлов для отклонения
- H - охватывают хосты (ограниченный-D)
- D - домены для проверки (ограниченный этими доменами)
Самой большой проблемой является большинство возвратов страниц Blogger, не имеют Измененного в последний раз HTTP-заголовка в ответе, таким образом, это повторно загружает неизменные файлы и регистрирует следующее сообщение:
"Измененные в последний раз пропавшие без вести заголовка - выключенные метки времени".
Если я мог бы выяснить, как подавить то поведение, я буду счастлив, потому что это - то, что заставляет его замедлиться, и также мое локальное резервное копирование должно иметь дело с теми файлами каждую ночь, потому что оно думает, что они изменились (когда они не имеют).