Я могу загрузить все ссылки в веб-странице с расширениями PDF, zip, и т.д.
Но один сайт имеет больше чем 50 ссылок, который заканчивается как это: "http://....../showDocument.php? DocumentID=121" "http://....../showDocument.php? DocumentID=33" "http://....../showDocument.php? DocumentID=67"
Когда я копирую ссылки на свою программу загрузки (Орбита), она не может понять, что они связаны с файлами PDF. И загрузки php файлы. Как я могу зафиксировать это и загрузить все ссылки легко?Спасибо
Веб-серверы передают тип обратно файла (известный как Тип MIME), что Вы загружаете в HTTP-заголовках, который большая часть использования браузеров определить, который приложение использовать для открытия его с тем, если это не файл, который это может обработать исходно. Это - то, как браузер знает, что должен запустить Word, или Excel или Acrobat (или безотносительно) для открытия файла. Я предполагаю, что Орбита просто использует расширение файла вместо этого. Так как код PHP может быть написан для передачи любого вида обратно типа файла динамично нет действительно никакого способа определить, какой тип файла загружается просто путем осмотра расширения файла.
Если это верно, затем это - ограничение Вашего загрузчика, и Вы захотите искать тот, который осмотрит тип файла на основе HTTP-заголовка Типа контента, который отправляется веб-сервером.
Вы могли использовать wget.
#/bin/bash
for i in {0 .. 50}
do
wget http://... ... /showDocument.php?DocumentID=${i}
done
Это предполагает, что 'числа' между 0 и 50. Если они - числа случайного выхода, то просто делают верхнюю границу для для цикла действительно высоко (т.е. 1000) и заставляют wget проигнорировать ошибки.