Почему считает не все символы?

Question

demon trigger @Core2Quad777

Почему считает не все символы?

Пишу парсер, должен выводить спарсенный текст и количество символов. Символов в оригинальном тексте точно больше, чем получается. Вот код и результат:

from bs4 import BeautifulSoup
import requests

def onlytxt():
    url = 'https://ilibrary.ru/text/473/p.4/index.html'
    page = requests.get(url)
    filteredTXT = []
    a = filteredTXT
    allTXT = []
    soup = BeautifulSoup(page.text, "html.parser")
    allTXT = soup.findAll('span')
    sc = 0
    for data in allTXT:
        if data.find('span') is not None:
            filteredTXT.append(data.text)
    print(len(a))
    for data in filteredTXT:
        print(data)
onlytxt()

314

Вопрос задан более года назад
69 просмотров

6 комментариев

Подписаться 1 Простой 6 комментариев

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 16 минут назад
- 5 просмотров
0

ответов
Python

+2 ещё

Средний
Возможно ли сделать так, чтобы Telegram GPT-Yandex.Cloud Бот отвечал не только на текстовые сообщения, но и на картинки? И если да, то как?
- 1 подписчик
- 31 минуту назад
- 14 просмотров
1

ответ
Python

Средний
Как выполнить авторизацию MS CHAP 2?
- 1 подписчик
- 2 часа назад
- 22 просмотра
0

ответов
WordPress

+1 ещё

Средний
Парсинг сайта на wordpress?
- 1 подписчик
- 6 часов назад
- 46 просмотров
1

ответ
Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- 6 часов назад
- 63 просмотра
2

ответа
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 8 часов назад
- 14 просмотров
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 9 часов назад
- 53 просмотра
0

ответов
Парсинг

+1 ещё

Средний
Как правильно написать функцию IMPORTJSON для парсинга цен криптовалют в гугл таблицу?
- 1 подписчик
- 9 часов назад
- 12 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 20 часов назад
- 118 просмотров
1

ответ
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 22 часа назад
- 77 просмотров
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Установить Windows и терминалы RDP на Dedicated Server (без лицензии)

19 апр. 2024, в 21:24

3000 руб./за проект

Разработка VST-плагина

19 апр. 2024, в 20:43

20000 руб./за проект

Нарисовать баннер для интернет-магазина

19 апр. 2024, в 20:35

500 руб./в час

Запустил ваш код, выдает 314 и следом большой текст рассказа какой то.
Максим Припадчев, да, так и должно быть
314 - кол-во символов, но оно не верно

текст - исходный текст на странице
Артемий Сагутдинов, Все понял, я прочитал ваш вопрос и подумал что кроме 314 ничего не выводит. 314 это количество data.text элементов в массиве.
Максим Припадчев, понял, а как мне найти количество символов?
Артемий Сагутдинов, А под количеством символов вы имеете ввиду (без пробелов или с пробелами)?

Answer 1 · 2023-01-16 15:27:16

где у вас print(a) вставьте вот этот код, вы выводите на печать длину массива, а нужно суммировать длины строк каждого элемента массива.
print(sum(len(i) for i in a))

Почему считает не все символы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт