Задать вопрос
@Artyom_Kopan

Как сохранить жирный шрифт при парсинге в pandas?

Я пишу парсер для поиска абитуриентов на агрегаторе (хочу узнать, сколько моих конкурентов уже подали согласие в другие вузы). На агрегаторе admlist.ru есть колонка "Другие ОП", и вуз, в который данный абитуриент подал согласие, выделен жирным шрифтом (например admlist.ru/spbu/84dfc6825d54d82d7c23133176f812a1.html).
Вот мой код для парсинга:
import pandas as pd
import requests
import urllib

url = 'http://admlist.ru/spbu/84dfc6825d54d82d7c23133176f812a1.html'
html = requests.get(url).content
df_list_admlist = pd.read_html(html)
admlist = df_list_admlist[-1]
admlist["Другие ОП"][4]


Pandas считывает колонку "Другие ОП" как обычную строку.
Как можно сделать так, чтобы жирный шрифт в этом случае сохранялся (или хотя бы чтобы текст из этой колонки считывался в виде html) ?
  • Вопрос задан
  • 130 просмотров
Подписаться 1 Средний Комментировать
Решения вопроса 1
LazyTalent
@LazyTalent
Data Engineer, Freelancer
Никак, надо писать свой парсер.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Aporia Севастополь
от 50 000 до 100 000 ₽
Clain Лимассол
от 5 000 €