Задать вопрос

Как осуществить парсинг ajax web страницы?

Какие есть способы и инструменты, для парсинга страницы, содержимое которого подгружается по ajax при скролле?

Предполагаю некоторые варианты:
1) Проанализировать, какого вида и на какой адрес отправляется ajax запрос, эмулировать эти действия и парсить ответ.
2) Использовать инструменты автоматизации браузера (PhantomJS, selenium).

Предложения, пожелания, идеи?
  • Вопрос задан
  • 9834 просмотра
Подписаться 5 Оценить Комментировать
Решения вопроса 1
maxaon
@maxaon
Если вам надо парсить два-три сайта, тогда конечно первый вариант. Если много или сложная логика - тогда фантом, это не так сложно.
Если парсить не долго и не часто - юзерскрипт/плагин для парсинга. Открыл браузер, нажал кнопочку, подождал, загрузил файл.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@SashaSkot
Специалист широкого профиля
Единственный правильный вариант вы описали под номеров 1. Если хочется хардора и секса - можете реализовать через браузерный компонент и отслеживать изменения контейнера. Но это Тeрмоpектaльный криптоанализ.
Ответ написан
Комментировать
@portfelio
Если у сайта нет запрета отображения во фрейме, то открыть страницу во фрейме и парсить.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы