воскресенье, 10 декабря 2006 г.

Wget. Качаем только определенные файлы

Много чего полезного можно сделать с помощью старой и проверенной программы wget. Много чего написано о ее использовании. Wget очень хорошо документирован. Кто знает хорошо английский:

man 1 wget

Кому приятней на русском, пожалуйста:



wget --help

Или идем по ссылке и читаем, опять же на русском.

Для теж же, кто не хочет ничего читать и кому надо просто выкачивать с веб-странички лишь определенные файлы, допустим картинки в формате jpg, читайте ниже.

Допустим на каком-нибудь сайте набрели на кучу прикольных картинок. Вот как я например набрел на медведей :). И захотелось мне их скачать...

Создаю у себя в домашней директории папку polar_bear:

serhiy@kubuntu:~$ mkdir polar_bear

Захожу:

serhiy@kubuntu:~$ cd polar_bear/

И самое главно, качаю в нее:

serhiy@kubuntu:~/polar_bear$ wget -r -nd -np -l1 -A '*.jpg' http://www.webpark.ru/comments.php?id=18476

Все. Я выкачал только *.jpg изображения. Таким образом можно выкачивать любые файлы. Для этого нужно просто заменить *.jpg на другое расширение.

4 коммент.:

virens комментирует...

Отличный пост! Сам всё собираюсь про wget написать. Если я воспользуюсь некоторыми идеями вашего поста - не возражаете? Со ссылкой, разумеется.

serhiy cherevko комментирует...

Конечно не возражаю. Наоборот это хорошо :). Буду рад прочесть ваш пост о wget. В тексте приведена хорошая ссылка о wget. Может поможет.

virens комментирует...

Да, ссылка интересная, спасибо. Теперь надо всё объеденить и описать.

Анонимный комментирует...

А как быть, если изображания скачиваемой страницы частично или полностью хотлинкуются с другого сервера?