0dminik
@0dminik
Учусь верстке и программирование на python

Парсер На Ruby?

Ребят нужна помощь.Написал парсер по сайту ,но он собирает данные с одной страницы,как сделать чтобы он переходил на другую страницу и дальше собирал данные?Могу показать код скрипта
  • Вопрос задан
  • 2762 просмотра
Пригласить эксперта
Ответы на вопрос 2
@Fly3110
web developer
Парсить ссылки в коде и добавлять их в очередь заданий на последующий парсинг.
Ответ написан
Для не сильно сложных парсингов хватит open-uri и nokogiri

В цикле перебираешь свой массив с нужными страницами и сохраняешь все ссылки.
array_of_pages.each_with_index do |page_for_parsing, index|
  urls[index] = "http://www.site.com/#{page_for_parsing}"
end

Затем перебираешь ссылки и вытаскиваешь с помощью nokogiri нужную информацию.
urls.each_with_index do |url_for_parsing, index|
  page = open urls[index]
  doc = Nokogiri::HTML(page)
  doc.css('.class').each do |stuff|
    # Обрабатываем информацию
  end


Если надо что-то посложнее, то гем mechanize. На Хабре есть маленькая хорошая серия статей по парсингу на Руби.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы