Как я могу загрузить весь (активный) phpbb форум?

Один из форумов, которые я часто посещаю (и добавили МНОГО качественного содержания также), кажется, имеет проблемы с их сервером. Я не уверен в их способности разобраться в проблемах, которые они имеют и в том, чтобы говорить с одним из администраторов, он упомянул, что они не создают резервную копию данных.

Как полное отступают, упаковывают что-то, идет ужасающе неправильно, я хочу загрузить весь форум. Я знаю, что не могу загрузить DB или файлы PHP и т.д... Я просто хочу сделать локально доступную для просмотра копию всего форума.

Это означает, что я мог (когда у меня есть время), передают сообщения новому сайту, должен они запуститься новый (нарочно или не).

Есть ли какие-либо инструменты, которые позволили бы это?

Примечание стороны: Очевидно, его действительно важное, я могу просмотреть его локально..., который был бы очень трудным если каждая из неподвижных точек ссылок на 'http://www.thesite.com/forum/specific_page.php', а не '/forum/specific_page.php'.

7
задан 04.03.2010, 20:43

3 ответа

Попробуйте некоторую комбинацию флагов wget как:

wget -m -k www.example.org/phpbb

Где-m является зеркалом, и-k, "преобразовывают ссылки". Можно также хотеть добавить-p к образам загрузки, поскольку я не могу вспомнить, делает ли-m это.

1
ответ дан 07.12.2019, 14:46

Я делаю это прямо сейчас. Вот команда, которую я использую:

wget -k -m -E -p -np -R memberlist.php*,faq.php*,viewtopic.php*p=*,posting.php*,search.php*,ucp.php*,viewonline.php*,*sid*,*view=print*,*start=0* -o log.txt http://www.example.com/forum/

Я хотел разделить те противные идентификационные вещи сессии (sid=blahblahblah). Они, кажется, добавляются автоматически индексной страницей и затем присоединяются ко всем ссылкам подобным вирусу способом. За исключением одного запасшегося где-нибудь - который связывается с плоскостью index.php, который затем не продолжает sid = параметр. (Возможно, существует способ вынудить рекурсивный wget начать с index.php - я не знаю).

Я также исключил некоторые другие страницы, которые приводят к большому количеству сохраняемого хлама. В особенности memberlist.php и viewtopic.php, где p = указан, могут создать тысячи файлов!

Из-за этой ошибки в wget http://savannah.gnu.org/bugs/?20808 это все еще загрузит поразительное количество тех бесполезных файлов - esepcially viewtopic.php? p = - прежде просто удалить их. Таким образом, это собирается записать много времени и пропускной способности.

8
ответ дан 07.12.2019, 14:46

HTTrack является инструментом, который мог бы выручить Вас. Я не уверен, будет ли это работать над форумами все же.

-1
ответ дан 07.12.2019, 14:46

Теги

Похожие вопросы