Задать вопрос
@Hartonone

Какой код нужно добавить к парсеру через python чтобы не удалял блоки инстаграмма и твитера?

На Ссылка удалена модератором. могут быть такие вот блоки

6436d4f0e226f936678914.png

При парсенге он их удаляет, как мне их сохранить

Использовал вот такое, но все равно удаляет
# Не удаляем блоки Instagram и Twitter
        for instagram in article_text.find_all("blockquote", class_="instagram-media"):
            continue

        for twitter in article_text.find_all("blockquote", class_="twitter-tweet"):
            continue
  • Вопрос задан
  • 63 просмотра
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Python-разработчик: расширенный курс + нейросети
    12 месяцев
    Далее
  • Академия Эдюсон
    Python-разработчик
    9 месяцев
    Далее
  • ProductStar × РБК
    Профессия: Python-разработчик + ИИ
    8 месяцев
    Далее
Решения вопроса 1
SoreMix
@SoreMix Куратор тега Python
yellow
Подобные вставки сделаны через iframe теги. Данные генерируются во время рендера страницы в браузере. Если делать обычный GET запрос на страницу, этих данных не будет в коде страницы.

Смотря что нужно с этим сделать, можно текст допустим вытащить через API Twitter / Instagram, предварительно достав ID нужной записи.
Можно поменять тип парсинга, и собирать данные через условный Selenium.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
ITK academy Краснодар
от 220 000 до 300 000 ₽
ITK academy Краснодар
от 75 000 ₽
DimaTech Ltd Краснодар
от 140 000 до 140 000 ₽