Задать вопрос

ToxaDHD @ToxaDHD

html

Почему код страницы, полученный через get запрос библиотеки requests, отличается от кода из браузера?

Предположим, что я хочу пропарсить главную страницу Ютуба. Для получения html-кода главной страницы я использую такой код:

import requests

url = 'https://www.youtube.com/'

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.87 Safari/537.36"
    }

req = requests.get(url=url, headers=headers)
src = req.text

with open('youtube.html', 'w', encoding='utf-8') as file:
    file.write(src)

В результате я получаю файл в котором есть код, но код он далеко не тот, что я вижу, когда я нажимаю на "Посмотреть код" в браузере.
Мне бы хотелось понять почему в файле другой код и как получить тот код, который виден через браузер.

Вопрос задан более трёх лет назад
167 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Frontend-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по тестированию + ИИ

6 месяцев

Далее

Решения вопроса 1

AntVlad @AntVlad

Это потому что содержимое страницы подгружается динамически. Надо работать через эмулятор браузера. Например, Selenium.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Пригласить эксперта

Ответы на вопрос 1

IgorPI

Игорь @IgorPI

Потому, что youtube.com это SPA

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- вчера
- 126 просмотров
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 93 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 107 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 362 просмотра
0

ответов
HTML

+2 ещё

Простой
Как запретить формирования ссылок вида /tel:?
- 2 подписчика
- 01 июл.
- 303 просмотра
3

ответа
HTML

+1 ещё

Средний
Как выставить элементу ширину по содержимому при переносах?
- 2 подписчика
- 30 июн.
- 179 просмотров
1

ответ
HTML

+3 ещё

Средний
Как создать каркас верстки который будет считаться по высоте, а не по ширине?
- 4 подписчика
- 26 июн.
- 412 просмотров
4

ответа
JavaScript

+2 ещё

Простой
Не работает тень + слайдер, есть варианты?
- 2 подписчика
- 21 июн.
- 209 просмотров
1

ответ
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 240 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 672 просмотра
2

ответа
Показать ещё Загружается…