[go: nahoru, domu]

Skip to content

Web-паук который вытаскивает из страниц все существующие изображения.

Notifications You must be signed in to change notification settings

maratvmk/grabber

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Grabber

=======

Web-паук который вытаскивает из страниц все существующие изображения.

Как запускать?

linux$ ./grab.rb  google.com tmp
  • grab.rb - название программы, который принимает два аргумента
  • Первый аргумент url страницы, откуда нужно скачать все изображения, здесь это google.com
  • Второй аргумент название директории куда нужно скачать файлы, здесь tmp

Как работает?

Программа скачивает исходный код страницы google.com с помощью библиотеки open-uri.
Находит из этой страницы все теги <img src="..." /> и сохраняет значения атрибутов src, используя регулярные выражения и MatchData. Затем скачивает их в директорию указанную в качестве второго аргумента программы.

About

Web-паук который вытаскивает из страниц все существующие изображения.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages