Как парсить динамический контент, где разные данные запроса (AJAX POST)?

Question

Bjornie @Bjornie

Изучаю Python

Как парсить динамический контент, где разные данные запроса (AJAX POST)?

Разрабатывая парсер столкнулся с проблемой парсинга динамических страниц, точнее перехода по ссылкам пагинации, которые имеют вид как на скриншоте:

А в качестве запроса передают след. данные:

После клика по номеру страницы контент на странице подменяется, адрес в браузере не меняется, при этом селекторы пейджеров имеют не совсем логичные имена, по-этому нельзя определить их промежуток.

UPD: если это важно. Ответом приходят кусок готового HTML, который полностью подменяет нужную мне таблицу данных вместе с пейджерами.

Если честно мне не совсем понятно как сделать обход такой пагинации. Пытался гуглить, смотрел статьи, уроки, но везде говорится о парсинге более простых AJAX-запросов, где намного проще составить запроса для парсинга.

Вопрос задан более трёх лет назад
5239 просмотров

5 комментариев

Подписаться 5 Оценить 5 комментариев

al_gon @al_gon

Чем парсите? Что парсите?
Напрашивается Selenium. Но неуверен, информации мало.

Написано более трёх лет назад
Bjornie @Bjornie Автор вопроса

al_gon: на данный момент я пытаюсь понять КАК мне это парсить, затем выбирать инструмент. PHP или Python, но скорее всего второе. Уже посмотрел несколько примеров, но там не было таких запросов. Selenium не разу не использовал, но готов применить. Хотя мне непонятно с чего начать. Зашел на 1-ю страниц, выбрал #ct10_left_Pager чтобы посмотреть его детей (ссылки), а там ... Со статикой таких вопросов не было, здесь оказалось сложнее.

Написано более трёх лет назад
Андрей @ntzch

Bjornie: какой сайт? Опишите точнее, что именно парсите, без этого адекватно вам нельзя будет помочь

Написано более трёх лет назад
Bjornie @Bjornie Автор вопроса

Андрей: по авторизации парсинг, не могу сюда кинуть эти данные. (могу написать в скайп)

Написано более трёх лет назад
Андрей @ntzch

Bjornie: ну, к примеру, я тоже могу зарегиться ))) Или там закрытая регистрация?

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 215 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 225 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 76 просмотров
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 106 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 99 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 119 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 467 просмотров
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 3 подписчика
- 05 мар.
- 999 просмотров
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 322 просмотра
1

ответ
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 374 просмотра
4

ответа
Показать ещё Загружается…

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

Чем парсите? Что парсите?
Напрашивается Selenium. Но неуверен, информации мало.
al_gon: на данный момент я пытаюсь понять КАК мне это парсить, затем выбирать инструмент. PHP или Python, но скорее всего второе. Уже посмотрел несколько примеров, но там не было таких запросов. Selenium не разу не использовал, но готов применить. Хотя мне непонятно с чего начать. Зашел на 1-ю страниц, выбрал #ct10_left_Pager чтобы посмотреть его детей (ссылки), а там ... Со статикой таких вопросов не было, здесь оказалось сложнее.
Bjornie: какой сайт? Опишите точнее, что именно парсите, без этого адекватно вам нельзя будет помочь
Андрей: по авторизации парсинг, не могу сюда кинуть эти данные. (могу написать в скайп)
Bjornie: ну, к примеру, я тоже могу зарегиться ))) Или там закрытая регистрация?

Answer 1 · 2016-12-01 19:18:44

Пробовали отследить какие запросы формируются (хотя бы в консоле разработчика у браузера - вкладка Network) и какие ответы на них приходят?

Answer 2 · 2016-12-02 17:08:32

Попробуйте через phantomjs парсить динамические сайты.

PhantomJS is a headless WebKit scriptable with a JavaScript API. It has fast and native support for various web standards: DOM handling, CSS selector, JSON, Canvas, and SVG.

stackoverflow.com/questions/13287490/is-there-a-wa...

Как парсить динамический контент, где разные данные запроса (AJAX POST)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт