Как получить все *.html файлы с веб-сайта с помощью инструментов командной строки Unix и регулярного выражения

Я хотел бы получить все .html файлы с веб-сайта, который имеет определенный текст на его имени:

например, this_is_good_site.html

Так, я хотел бы загрузить .html файлы словом, "хорошим" на его имени. Я попробовал wget и завихрение, но я не понял, как я могу выбрать те файлы с помощью регулярного выражения? Существует ли решение Python или Perl, если инструменты командной строки на Unix не могут сделать этого?

1
задан 18.01.2010, 21:48

2 ответа

Ну, если бы Вы желаете сделать это с Python, Вы могли бы изучить использование urlib2 - у Вас также, вероятно, была бы лучшая удача с этим вопросом на StackOverflow.

1
ответ дан 12.12.2019, 09:22

Попробуйте копировальное устройство веб-сайта HTTrack или подобную программу, лучше, чем командная строка. загрузите все это на каталог, вид .html копируют и вставляют их всех где-то в другом месте, удаляют остатки

http://www.httrack.com/

1
ответ дан 12.12.2019, 09:22

Теги

Похожие вопросы