Почему Python не сохраняет в excel так как надо?

Question

sqdima @sqdima

Почему Python не сохраняет в excel так как надо?

Имеется код который парсит страницу форума .
Суть: парсит информацию о пользователе, ссылке на его профиль и сообщение которое пользователь оставил, всё это сохраняет в Эксель.
Но проблема вот в чем, список пользователей создает в файле нормальный как и ссылки на их профиль, но само сообщение привязывает только первое со страницы, ну или то

from urllib.request import urlopen
from urllib.parse import urljoin
from bs4 import BeautifulSoup
from time import sleep
from lxml.html import fromstring
from lxml.etree import XMLSyntaxError
import xlsxwriter

URL = 'http://www.banki.ru/forum/?PAGE_NAME=read&FID=51&TID=150146'
ITEM_PATH = '.forum-user-name'
DESCR_PATH = '.forum-post-entry'

def parse_posts():
	f = urlopen(URL)
	list_html = f.read().decode('cp1251')
	list_doc = fromstring(list_html)
	posts = []
	for elem in list_doc.cssselect(ITEM_PATH):
		a = elem.cssselect('a')[0]
		href = a.get('href')
		url = urljoin(URL, href)
		title = a.get('title')
		name = a.text_content()

		descr = list_doc.cssselect(DESCR_PATH)[0].text_content()

		post = {'name': name, 'url': url, 'descr': descr}
		
		posts.append(post)
	return posts	
		
def export_excel(filename, posts):
	workbook = xlsxwriter.Workbook(filename)
	worksheet = workbook.add_worksheet()
	
	bold = workbook.add_format({'bold': True})
	field_names = ('Название темы', 'URL', 'ДиФ')
	for i, field in enumerate(field_names):
		worksheet.write(0, i, field, bold)
		
	fields = ('name', 'url', 'descr')
	for row, post in enumerate(posts, start=1):
		for col, field in enumerate(fields):
			worksheet.write(row, col, post[field])
	workbook.close()
			
			
def main():
	posts = parse_posts()
	export_excel('posts1.xlsx', posts)
	
if __name__ == '__main__':
	main()

Суть: парсит информацию о пользователе, ссылке на его профиль и сообщение которое пользователь оставил, всё это сохраняет в Эксель.
Но проблема вот в чем, список пользователей создает в файле нормальный как и ссылки на их профиль, но само сообщение привязывает только первое со страницы, ну или то сообщение по счету которое изменишь в этом отрезке кода. Убрав [0] вообще выдает ошибку

descr = list_doc.cssselect(DESCR_PATH)[0].text_content()

Нужно чтобы соответственно было, пользователь ссылка и его сообщение.
Помогите пожалуйста, уже двое суток сижу туплю...

Вопрос задан более трёх лет назад
503 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 1 подписчик
- 5 часов назад
- 65 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 193 просмотра
0

ответов
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 300 просмотров
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 234 просмотра
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 153 просмотра
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 127 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 255 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 141 просмотр
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 142 просмотра
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 146 просмотров
0

ответов
Показать ещё Загружается…

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

Answer 1 · 2016-02-04 04:04:45

for post in list_doc.cssselect('.forum-post-table'):
    user = post.cssselect('.forum-user-name a')[0]
    name = user.text_content()
    url = urljoin(URL, user.get('href'))
    # title = user_name.get('title')
    descr = post.cssselect('.forum-post-text')[0].text_content()

Набросал на коленке. В бою не проверял. Если даже остались какие-то ошибки, то, надеюсь, суть я передал.

Почему Python не сохраняет в excel так как надо?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт