Пишу парсер, должен выводить спарсенный текст и количество символов. Символов в оригинальном тексте точно больше, чем получается. Вот код и результат:
from bs4 import BeautifulSoup
import requests
def onlytxt():
url = 'https://ilibrary.ru/text/473/p.4/index.html'
page = requests.get(url)
filteredTXT = []
a = filteredTXT
allTXT = []
soup = BeautifulSoup(page.text, "html.parser")
allTXT = soup.findAll('span')
sc = 0
for data in allTXT:
if data.find('span') is not None:
filteredTXT.append(data.text)
print(len(a))
for data in filteredTXT:
print(data)
onlytxt()
314