Как осуществить парсинг ajax web страницы?

Какие есть способы и инструменты, для парсинга страницы, содержимое которого подгружается по ajax при скролле?

Предполагаю некоторые варианты:
1) Проанализировать, какого вида и на какой адрес отправляется ajax запрос, эмулировать эти действия и парсить ответ.
2) Использовать инструменты автоматизации браузера (PhantomJS, selenium).

Предложения, пожелания, идеи?
  • Вопрос задан
  • 9834 просмотра
Решения вопроса 1
maxaon
@maxaon
Если вам надо парсить два-три сайта, тогда конечно первый вариант. Если много или сложная логика - тогда фантом, это не так сложно.
Если парсить не долго и не часто - юзерскрипт/плагин для парсинга. Открыл браузер, нажал кнопочку, подождал, загрузил файл.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@SashaSkot
Специалист широкого профиля
Единственный правильный вариант вы описали под номеров 1. Если хочется хардора и секса - можете реализовать через браузерный компонент и отслеживать изменения контейнера. Но это Тeрмоpектaльный криптоанализ.
Ответ написан
Комментировать
@portfelio
Если у сайта нет запрета отображения во фрейме, то открыть страницу во фрейме и парсить.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
23 нояб. 2024, в 01:31
1000 руб./за проект
23 нояб. 2024, в 00:16
2000 руб./за проект