saytik
@saytik
Веб-разработчик

Как правильно парсить страницу, на которой надо выбрать производителя?

Есть задача получить данные по странице хттпс://www.emex.ru/f?detailNum=NPLPO3135&brandId=-2807 (например). При первом заходе на страницу, сайт спрашивает производителя. Не смотря на то, что мы GET передаем бренд-ID. Если еще раз зайти по этому урлу, то сразу показывает данные на выбранного производителя. Но в куках ничего нет. Куда сохраняет не понятно. Как быть? Подскажите как написать скрипт для выбора нужного бренда. Заранее благодарен

Для парсинга использую phantomJS.
  • Вопрос задан
  • 686 просмотров
Пригласить эксперта
Ответы на вопрос 1
glebovgin
@glebovgin
Full Stack Web Developer
Есть хорошая новость и плохая.

Хорошая:
Перед обращением по URL вы можете вручную выставить cookie isBestLocationDetected = true и у вас не будет экрана запроса производителя.

Плохая:
Если будете активно обращаться к серверу, то получаете капчу.

Если же финт с cookie не устраивает, то при парсинге просто определяете что именно сейчас получил парсер - страницу с данными о товаре или выбор производителя. Если производителя, то phantomJS умеет в click(), так что проблем быть не должно. Но, я думаю, cookie должно хватить.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 нояб. 2024, в 12:20
10000 руб./за проект
22 нояб. 2024, в 11:53
3000 руб./за проект
22 нояб. 2024, в 11:51
20000 руб./за проект