Как получить текст при парсинге?

Question

ParnishkaSPB @ParnishkaSPB

Как получить текст при парсинге?

from bs4 import BeautifulSoup as BS
import requests
import psycopg2
import os


def pages():
    host = 'https:// www. tripadvisor .ru/'(Пробелы поставлены нарочно)
    pages1 = 'Hotels-g298507-oa'
    pages2 = '--St_Petersburg_Northwestern_District-Hotels.html'
    template = '{}{}{}{}'
    countpages = 0
    for h in range(0, 152):
        url = template.format(host, pages1, countpages, pages2)
        responce = requests.get(url).text
        html = BS(responce, 'html.parser')
        for href in html.select('.ui_column'):
            a = href.select("a")
            text = href.find_all('span', class_='text').text
            if len(a) > 0:
                print (a[0].text)
            print (text)
        countpages = (h * 10) * 3

if __name__ == '__main__':
    os.system('clear')
    pages()

Есть такой код, выдается ошибка в моменте с text = href.find_all('span', class_='text').text. Ошибка:

ResultSet object has no attribute 'text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

Дело в том, что на странице в классом "text" есть 2-3 атрибута(стоят рядом), я не знаю как вытащить только текст из этих атрибутов, нужна помощь

Вопрос задан более трёх лет назад
710 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Что не так с моими асинхронными запросами?
- 1 подписчик
- вчера
- 130 просмотров
0

ответов
Python

Простой
Как в питоне генерировать (создавать+заполнять значениями по умолчанию) вложенный словарь так, чтобы вложенные элементы не были копиями друг друга?
- 1 подписчик
- 20 авг.
- 114 просмотров
1

ответ
Python

+1 ещё

Простой
Из-за чего возникает ошибка неверный дескриптор?
- 1 подписчик
- 19 авг.
- 98 просмотров
1

ответ
Python

Простой
Непонимание ошибки yolo8?
- 1 подписчик
- 19 авг.
- 59 просмотров
0

ответов
Python

+1 ещё

Простой
Как грамотно изначально сделать телеграмм бота на Python с помощью aiogram чтобы выдерживал как минимум 10к пользователи и можно было масштабировать?
- 1 подписчик
- 18 авг.
- 220 просмотров
2

ответа
Python

Простой
Как сделать lock для двух асинхронных программ?
- 1 подписчик
- 18 авг.
- 130 просмотров
1

ответ
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 144 просмотра
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 142 просмотра
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- 16 авг.
- 231 просмотр
1

ответ
Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- 15 авг.
- 144 просмотра
0

ответов
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2020-06-17 21:30:11

У Вас find_all возвращает список, у него нет такого метода.

You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

Answer 2 · 2020-06-18 04:21:43

Поддержу пользователя @Sergei1337
вот тут у вас:
text = href.find_all('span', class_='text')
получается список. и поэтому выбрать текст, который там есть, можно циклом:

for i in text:
    print(i.text)

т.е. просто добавьте короткий цикл в ваш скрипт

Как получить текст при парсинге?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт