Почему считает не все символы?

Question

demon trigger @Core2Quad777

Почему считает не все символы?

Пишу парсер, должен выводить спарсенный текст и количество символов. Символов в оригинальном тексте точно больше, чем получается. Вот код и результат:

from bs4 import BeautifulSoup
import requests

def onlytxt():
    url = 'https://ilibrary.ru/text/473/p.4/index.html'
    page = requests.get(url)
    filteredTXT = []
    a = filteredTXT
    allTXT = []
    soup = BeautifulSoup(page.text, "html.parser")
    allTXT = soup.findAll('span')
    sc = 0
    for data in allTXT:
        if data.find('span') is not None:
            filteredTXT.append(data.text)
    print(len(a))
    for data in filteredTXT:
        print(data)
onlytxt()

314

Вопрос задан более двух лет назад
84 просмотра

6 комментариев

Подписаться 1 Простой 6 комментариев

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- вчера
- 145 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 233 просмотра
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 213 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 146 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 112 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 249 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 135 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 138 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 141 просмотр
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 259 просмотров
2

ответа
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Запустил ваш код, выдает 314 и следом большой текст рассказа какой то.
Максим Припадчев, да, так и должно быть
314 - кол-во символов, но оно не верно

текст - исходный текст на странице
Артемий Сагутдинов, Все понял, я прочитал ваш вопрос и подумал что кроме 314 ничего не выводит. 314 это количество data.text элементов в массиве.
Максим Припадчев, понял, а как мне найти количество символов?
Артемий Сагутдинов, А под количеством символов вы имеете ввиду (без пробелов или с пробелами)?

Answer 1 · 2023-01-16 15:27:16

где у вас print(a) вставьте вот этот код, вы выводите на печать длину массива, а нужно суммировать длины строк каждого элемента массива.
print(sum(len(i) for i in a))

Почему считает не все символы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт