wget: Выключите Вынужденный .html Retreival

При выполнении рекурсивной загрузки я указываю шаблон через-R параметр для wget для отклонения, но если этот файл является файлом HTML, wget загружает файл независимо от того, соответствует ли это шаблону.

например.

wget -r -R "*dynamicfile*" example.com

все еще получает файлы, такие как example.com/dynamicfile1.html

Существует ли способ предотвратить это?

0
задан 20.04.2010, 20:13

1 ответ

Это делает это, потому что wget использует файлы HTML для знания, где просканировать затем, поскольку это проверяет через веб-страницу. Я просто позволил бы wget вести свой бизнес и затем делаю комнату *.html после того, как он сделан, или что-то подобное.

Править: Выполнение rsync *dynamicfile* /foo/bar к второму каталогу мог бы быть лучший способ отфильтровать Ваши файлы, чтобы только сохранить тех с корректным именем (предполагающий, что Вы хотите сохранить некоторые файлы HTML, если у них есть правильное имя),

0
ответ дан 27.11.2019, 19:54

Теги

Похожие вопросы