@Artyom_Kopan

Как сохранить жирный шрифт при парсинге в pandas?

Я пишу парсер для поиска абитуриентов на агрегаторе (хочу узнать, сколько моих конкурентов уже подали согласие в другие вузы). На агрегаторе admlist.ru есть колонка "Другие ОП", и вуз, в который данный абитуриент подал согласие, выделен жирным шрифтом (например admlist.ru/spbu/84dfc6825d54d82d7c23133176f812a1.html).
Вот мой код для парсинга:
import pandas as pd
import requests
import urllib

url = 'http://admlist.ru/spbu/84dfc6825d54d82d7c23133176f812a1.html'
html = requests.get(url).content
df_list_admlist = pd.read_html(html)
admlist = df_list_admlist[-1]
admlist["Другие ОП"][4]


Pandas считывает колонку "Другие ОП" как обычную строку.
Как можно сделать так, чтобы жирный шрифт в этом случае сохранялся (или хотя бы чтобы текст из этой колонки считывался в виде html) ?
  • Вопрос задан
  • 107 просмотров
Решения вопроса 1
LazyTalent
@LazyTalent
Data Engineer, Freelancer
Никак, надо писать свой парсер.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы