Как вывести код с браузерным расширением?

Question

Electr1k @Electr1k

Как вывести код с браузерным расширением?

Есть сайт и браузерное расширение к нему, которое добавляет свой блок(div) в HTML сайта. Этот сайт я и решил парсить на питоне. Ничего не найдя в функционале requests + bs4 для работы с расширениями я решил парсить при помощи seleniuma. Подключил к браузеру расширение, но при получение HTML, программа выводит исходный код, а не код страницы с изменениями (браузерным расширением), хотя в браузере расширение отображается. Вот код:

from selenium import webdriver
import os
from selenium.webdriver.chrome.options import Options

headers = {'user-agent':'*', 'accept':'*'}


executable_path = "chromedriver.exe"
os.environ["webdriver.chrome.driver"] = executable_path

chrome_options = Options()
chrome_options.add_extension('1.crx') #расширение 

driver = webdriver.Chrome(executable_path=executable_path, options=chrome_options)
driver.get("*url*")
html = driver.page_source
print(html)

В документации seleniuma методов для вывода кода я не нашел, но нашел на просторах интернета .page_source
Я думал, что суть проблемы в методе .page_source, и он выводит исходный код, заменив этот метод на .find_element_by_id('') (поиск по id в коде) блок с расширением так же не выводится, хотя в браузере он отображается. Вот собственно вопрос почему не отображается блок с расширением и как это исправить?

Вопрос задан более трёх лет назад
458 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 147 просмотров
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 99 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 111 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 374 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 243 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 682 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 557 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 311 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 580 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 231 просмотр
2

ответа
Показать ещё Загружается…

Answer 1 · 2021-01-26 22:07:10

Всё же можно использовать requests, учитывая что большинство появляющихся сообщений появляются в XHR, позже добавлю примерную инструкцию.

1) Сначала открываем код элемента, заходим в Network, и в XHR, там в основном отображаются подгружаемый текст.

картинка

2) Далее можно нажать Preview или Response для ускорения поиска нужного скрипта

картинка

3) Когда нашли нужный заходим в Headers и получаем метод(get/post) а так же url для запроса

картинка

4) Копируем все (кроме того что идёт с ":" в начале) это будет нашим headers

картинка

Перед использованием так же нужно будет отформатировать под словарь, по типу
#accept: */*
head = {'accept': '*/*', ... }
5) Если это Post запрос, то так же достаём параметры из Payload
6) Повторяем запрос, со взятым методом и данными requests.get(url, headers = head)
или же если пост requests.post(url, headers = head, data = Payload)

Как вывести код с браузерным расширением?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт