Всем привет. Есть HTML файл с комментариями, нужно спарсить их. Я на самом деле из браузера скопировал html кусок с комментами и сохранил в файл.
Потому, что на сайте эти комменты не лежал по умолчанию, они тянутся с сервиса cackle. И bs4 на python их не получает. Теперь хочу с файла попробовать данные, только не пойму как с файлом работать.
Richard Kamsky, мне вот интересно, может у вас какой-то локальный интернет, в котором недоступна документация с примерами буквально на главной странице?
Ну или загуглить что-то вроде bs4 гайд?
(Буквально первая ссылка в выдаче ведет на подробную статью на хабре).
Александр Нестеров, ну документалку то я нашёл. Приведённые в нём примеры почему-то не сработали. Интерпритатор выдаёт пустой объект. Я не спец по питону, поэтому и задаю вопросы по таким простым темам.
serhiops, я делал задачу по клонированию структуры и вёрстки сайта на движок. Мне ради доп. таска теперь python учить, который скорее всего больше мне не понадобится?
Richard Kamsky, тогда приводи свой нерабочий код, желательно минимальную версию, которая демонстрирует косяк. На примере будет проще разобраться, может, дело-то не в BS4.
from bs4 import BeautifulSoup
import codecs
f = codecs.open("test.html", 'r', 'utf-8')
html = f.read()
soup = BeautifulSoup(html, "lxml")
user_name = soup.find_all(".mc-review-username")
for name in user_name:
print(name)