Как получить все *.html файлы с веб-сайта с помощью инструментов командной строки Unix и регулярного выражения

Question

Как получить все *.html файлы с веб-сайта с помощью инструментов командной строки Unix и регулярного выражения

Я хотел бы получить все .html файлы с веб-сайта, который имеет определенный текст на его имени:

например, this_is_good_site.html

Так, я хотел бы загрузить .html файлы словом, "хорошим" на его имени. Я попробовал wget и завихрение, но я не понял, как я могу выбрать те файлы с помощью регулярного выражения? Существует ли решение Python или Perl, если инструменты командной строки на Unix не могут сделать этого?

1

curl wget html unix mac

задан 18.01.2010, 21:48

Ссылка

2 ответа

Попробуйте копировальное устройство веб-сайта HTTrack или подобную программу, лучше, чем командная строка. загрузите все это на каталог, вид .html копируют и вставляют их всех где-то в другом месте, удаляют остатки

http://www.httrack.com/

1

ответ дан alpha1 12.12.2019, 09:22

Ссылка

Darren Newton · Accepted Answer · 12.12.2019, 09:22

Ну, если бы Вы желаете сделать это с Python, Вы могли бы изучить использование urlib2 - у Вас также, вероятно, была бы лучшая удача с этим вопросом на StackOverflow.

Как получить все *.html файлы с веб-сайта с помощью инструментов командной строки Unix и регулярного выражения

2 ответа

Теги

Похожие вопросы