При выполнении рекурсивной загрузки я указываю шаблон через-R параметр для wget для отклонения, но если этот файл является файлом HTML, wget загружает файл независимо от того, соответствует ли это шаблону.
например.
wget -r -R "*dynamicfile*" example.com
все еще получает файлы, такие как example.com/dynamicfile1.html
Существует ли способ предотвратить это?
Это делает это, потому что wget использует файлы HTML для знания, где просканировать затем, поскольку это проверяет через веб-страницу. Я просто позволил бы wget вести свой бизнес и затем делаю комнату *.html после того, как он сделан, или что-то подобное.
Править: Выполнение rsync *dynamicfile* /foo/bar
к второму каталогу мог бы быть лучший способ отфильтровать Ваши файлы, чтобы только сохранить тех с корректным именем (предполагающий, что Вы хотите сохранить некоторые файлы HTML, если у них есть правильное имя),