Задать вопрос

Как осуществить парсинг ajax web страницы?

Какие есть способы и инструменты, для парсинга страницы, содержимое которого подгружается по ajax при скролле?

Предполагаю некоторые варианты:
1) Проанализировать, какого вида и на какой адрес отправляется ajax запрос, эмулировать эти действия и парсить ответ.
2) Использовать инструменты автоматизации браузера (PhantomJS, selenium).

Предложения, пожелания, идеи?
  • Вопрос задан
  • 9837 просмотров
Подписаться 5 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Fullstack-разработчик на Python + нейросети
    20 месяцев
    Далее
  • Skillfactory
    Профессия Веб-разработчик
    12 месяцев
    Далее
  • Яндекс Практикум
    Фронтенд-разработчик
    10 месяцев
    Далее
Решения вопроса 1
maxaon
@maxaon
Если вам надо парсить два-три сайта, тогда конечно первый вариант. Если много или сложная логика - тогда фантом, это не так сложно.
Если парсить не долго и не часто - юзерскрипт/плагин для парсинга. Открыл браузер, нажал кнопочку, подождал, загрузил файл.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@SashaSkot
Специалист широкого профиля
Единственный правильный вариант вы описали под номеров 1. Если хочется хардора и секса - можете реализовать через браузерный компонент и отслеживать изменения контейнера. Но это Тeрмоpектaльный криптоанализ.
Ответ написан
Комментировать
@portfelio
Если у сайта нет запрета отображения во фрейме, то открыть страницу во фрейме и парсить.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы