Core2Quad777
@Core2Quad777

Почему считает не все символы?

Пишу парсер, должен выводить спарсенный текст и количество символов. Символов в оригинальном тексте точно больше, чем получается. Вот код и результат:
from bs4 import BeautifulSoup
import requests

def onlytxt():
    url = 'https://ilibrary.ru/text/473/p.4/index.html'
    page = requests.get(url)
    filteredTXT = []
    a = filteredTXT
    allTXT = []
    soup = BeautifulSoup(page.text, "html.parser")
    allTXT = soup.findAll('span')
    sc = 0
    for data in allTXT:
        if data.find('span') is not None:
            filteredTXT.append(data.text)
    print(len(a))
    for data in filteredTXT:
        print(data)
onlytxt()


314
  • Вопрос задан
  • 71 просмотр
Решения вопроса 1
Maksim_64
@Maksim_64
Data Analyst
где у вас print(a) вставьте вот этот код, вы выводите на печать длину массива, а нужно суммировать длины строк каждого элемента массива.
print(sum(len(i) for i in a))
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
SpectrumData Екатеринбург
от 150 000 до 200 000 ₽
Гринатом Москва
от 150 000 ₽
DIGITAL SECTOR Краснодар
от 150 000 до 250 000 ₽