@Hartonone

Какой код нужно добавить к парсеру через python чтобы не удалял блоки инстаграмма и твитера?

На Ссылка удалена модератором. могут быть такие вот блоки

6436d4f0e226f936678914.png

При парсенге он их удаляет, как мне их сохранить

Использовал вот такое, но все равно удаляет
# Не удаляем блоки Instagram и Twitter
        for instagram in article_text.find_all("blockquote", class_="instagram-media"):
            continue

        for twitter in article_text.find_all("blockquote", class_="twitter-tweet"):
            continue
  • Вопрос задан
  • 58 просмотров
Решения вопроса 1
SoreMix
@SoreMix Куратор тега Python
yellow
Подобные вставки сделаны через iframe теги. Данные генерируются во время рендера страницы в браузере. Если делать обычный GET запрос на страницу, этих данных не будет в коде страницы.

Смотря что нужно с этим сделать, можно текст допустим вытащить через API Twitter / Instagram, предварительно достав ID нужной записи.
Можно поменять тип парсинга, и собирать данные через условный Selenium.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы