Как спарсить несколько страниц по одному xpath?

Question

libertyswift @libertyswift

Как спарсить несколько страниц по одному xpath?

Есть несколько url страниц в списке
url1 = 'http://_______________________'
url2 = 'http://_______________________'
url3 = 'http://_______________________'
url_list = ['url1','url2','url3','url4']
Как спарсить их данные по одному xpath
С одной страничкой получается так
from grab import Grab
g = Grab()
g.go('http://______________________________')
print (g.doc.select('//div[@class="______________"]').text()[1:])
А как это сделать для списка url где xpath не меняется?

Вопрос задан более трёх лет назад
302 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 154 просмотра
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 102 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 113 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 377 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 244 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 686 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 558 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 311 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 584 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 231 просмотр
2

ответа
Показать ещё Загружается…

Answer 1 · 2016-02-14 21:49:09

Dimonchik @dimonchik2013

non progredi est regredi

цикл не?

g = Grab()
for url in urls:
  g.go('http://______________________________')
  print (g.doc.select('//div[@class="______________"]').text()[1:])

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2016-02-14 22:36:58

Что я делаю не так?
from grab import Grab
g = Grab()
url1 = 'http:________________________________'
url2 = 'http:________________________________'
url3 = 'http:________________________________'
url4 = 'http:________________________________'
urls = ['url1','url2','url3','url4']

for url in urls:
g.go(urls)
print (g.doc.select('//div[@class="______________"]').text()[1:])

___________________________________________________________________________________________________________________________
Нашел вот такое решение все работает НО print выводит значения в строку в квадратных скобках и кавычках, так ['Значение', 'Значение', 'Значение'] как можно вывести их в столбец ?
from grab import Grab
g = Grab()
url1 = 'http:_________________'
url2 = http:_________________'
url3 = http:_________________'

url_list = [url1, url2, url3 ]
def page_handler(url):
resp = g.go(url)
data = g.doc.select('//div[@class="________________"]').text()[1:]
return data

all_data = [page_handler(url) for url in url_list]
print(all_data)

Как спарсить несколько страниц по одному xpath?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт