Один из форумов, которые я часто посещаю (и добавили МНОГО качественного содержания также), кажется, имеет проблемы с их сервером. Я не уверен в их способности разобраться в проблемах, которые они имеют и в том, чтобы говорить с одним из администраторов, он упомянул, что они не создают резервную копию данных.
Как полное отступают, упаковывают что-то, идет ужасающе неправильно, я хочу загрузить весь форум. Я знаю, что не могу загрузить DB или файлы PHP и т.д... Я просто хочу сделать локально доступную для просмотра копию всего форума.
Это означает, что я мог (когда у меня есть время), передают сообщения новому сайту, должен они запуститься новый (нарочно или не).
Есть ли какие-либо инструменты, которые позволили бы это?
Примечание стороны: Очевидно, его действительно важное, я могу просмотреть его локально..., который был бы очень трудным если каждая из неподвижных точек ссылок на 'http://www.thesite.com/forum/specific_page.php', а не '/forum/specific_page.php'.
Я делаю это прямо сейчас. Вот команда, которую я использую:
wget -k -m -E -p -np -R memberlist.php*,faq.php*,viewtopic.php*p=*,posting.php*,search.php*,ucp.php*,viewonline.php*,*sid*,*view=print*,*start=0* -o log.txt http://www.example.com/forum/
Я хотел разделить те противные идентификационные вещи сессии (sid=blahblahblah). Они, кажется, добавляются автоматически индексной страницей и затем присоединяются ко всем ссылкам подобным вирусу способом. За исключением одного запасшегося где-нибудь - который связывается с плоскостью index.php, который затем не продолжает sid = параметр. (Возможно, существует способ вынудить рекурсивный wget начать с index.php - я не знаю).
Я также исключил некоторые другие страницы, которые приводят к большому количеству сохраняемого хлама. В особенности memberlist.php и viewtopic.php, где p = указан, могут создать тысячи файлов!
Из-за этой ошибки в wget http://savannah.gnu.org/bugs/?20808 это все еще загрузит поразительное количество тех бесполезных файлов - esepcially viewtopic.php? p = - прежде просто удалить их. Таким образом, это собирается записать много времени и пропускной способности.
HTTrack является инструментом, который мог бы выручить Вас. Я не уверен, будет ли это работать над форумами все же.