Как парсить контент, сгенерированный JS-ом на Python. Что посоветуете?

Question

mRelby @mRelby

Как парсить контент, сгенерированный JS-ом на Python. Что посоветуете?

Я в этом деле новичок, поэтому сразу попрошу не забрасывать мен камнями)

Сегодня куда не глянь - везде JS. Что собственно существенно усложняет парсинг, по крайней мере на Python так уж точно.
Двух библиотек: Requests в связке с bs4 - недостаточно. Либо я чего-то не знаю, в этом случае буду признателен, если тыкнете носом куда следует (в документацию).

Собственно вопрос: как и при помощи чего лучше всего парсить определенный контент со страниц, которые генерируются JS-ом?

Заранее спасибо за ответы.

Вопрос задан более трёх лет назад
267 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 5

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- вчера
- 67 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 229 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 226 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 629 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 544 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 304 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 557 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 139 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 339 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-09-24 18:49:30

Владислав Лысков @Vlatqa

selenium

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2020-09-24 22:11:33

Зависит от контента. Либо selenium либо, если, парсить надо то, что страница подгружает по API, то можно перехватить запрос к апишке и написать свою реализацию на requests\aiohttp\по вкусу.

Answer 3 · 2020-09-25 20:54:24

поддержу. не всегда Селениум нужен (да и долго, порой). Поизучайте сначала то, как сервер отдает контент (или приложите ссылку сервиса). Порой, нужно просто покопаться в том, как уходят запросы и как они возвращаются. И никакой Селениум не нужен.

Answer 4 · 2020-09-24 19:24:40

Dimonchik @dimonchik2013

non progredi est regredi

есть чуть более легкие тулзы с JS обработкой, но все они сложнее, так что Селениум

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2020-09-24 21:06:27

IDzone-x @IDzone-x

Костыли сила паттерны могила

Selenium и только

Ответ написан более трёх лет назад

Комментировать

Как парсить контент, сгенерированный JS-ом на Python. Что посоветуете?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт