Как организовать нормальный вывод xml для дальнейшей обработки?

Question

Иван Богатырев @crybabycry

Учу питон

Как организовать нормальный вывод xml для дальнейшей обработки?

При попытке загрузить xml для парсинга загружается байт-код, на сколько я понял, и ничего с ним нельзя сделать. В лучшем случае отображаются только латинские символы.

Код ниже:

import bs4 as bs
import urllib.request

source = urllib.request.urlopen('https://www.fl.ru/rss/all.xml?category=2').read()
soup = bs.BeautifulSoup(source,'lxml')


table = soup.find('channel')
table_rows = table.find_all('item')

print(table_rows[1])

Получаю:

<item>
<title></title>
<link/>https://www.fl.ru/projects/4080170/fullstack---nodejs-razrabotchik.html
                  <description></description>
<guid>https://www.fl.ru/projects/4080170/fullstack---nodejs-razrabotchik.html</guid>
<category></category><category></category>
<pubdate>Sat, 06 Jul 2019 21:40:45 GMT</pubdate>
</item>

А должен получить:

-<item>
-<title>
-<![CDATA[Fullstack - Node.js разработчик (Бюджет: 130000  руб.)]]>
</title>
<link>https://www.fl.ru/projects/4080170/fullstack---nodejs-razrabotchik.html</link>
-<description>
-<![CDATA[В тематике криптовалют нужно закончить несколько самостоятельных модулей на отдельных поддоменах, которые собирают информацию через API с главного проекта, важно заложить...]]>
</description>
<guid>https://www.fl.ru/projects/4080170/fullstack---nodejs-razrabotchik.html</guid>
-<category>
-<![CDATA[Разработка сайтов / Веб-программирование]]>
</category>
-<category>
-<![CDATA[Программирование / Системное программирование]]>
</category>
<pubDate>Sat, 06 Jul 2019 21:40:45 GMT</pubDate>
</item>

При принудительном переводе в utf-8 вообще всё превращается в кучу каких-то символов...

Крыша едет уже. Подсобите, ребят, не понимаю...

Вопрос задан более трёх лет назад
78 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 74 просмотра
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 114 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 186 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 217 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 197 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 225 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 246 просмотров
0

ответов
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 243 просмотра
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2019-08-15 10:11:35

Дмитрий Шицков @Zarom

soup = bs.BeautifulSoup(source.read().decode('cp1251'), 'lxml')

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-08-15 10:36:52

Не помогает...

Traceback (most recent call last):
  File "C:\feedscrape-master\25.py", line 6, in <module>
    soup = bs.BeautifulSoup(source.read().decode('cp1251'), 'lxml')
AttributeError: 'bytes' object has no attribute 'read'

Answer 3 · 2019-08-15 12:06:56

Владимир @vintello

зачем Вам BS если python отлично работает с xml без всяких прослоек ?

примеров куча

Ответ написан более трёх лет назад

Комментировать

Как организовать нормальный вывод xml для дальнейшей обработки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт