lina666
@lina666
Изучаю веб ЯП.

Как спарсить сайт olx?

Здравствуйте, столкнулась с одной проблемой, нужно написать парсер, при парсинге выдает нулевые массивы
Ссылка на сайт
Вот пример кода
$url = file_get_html('https://www.olx.ua/nedvizhimost/kharkov/?currency=USD');
 $findtest = $url->find('div.innerLayout');
echo $url;

Библиотеки которыми пыталась парсить: simple dom html, phpQuery -> результат одинаковый
5d2c865f84704539539375.png
5d2c866e42d57436404001.png
.
  • Вопрос задан
  • 4389 просмотров
Решения вопроса 1
@Verz1Lka
Web scraping expert
Очевидно, сайт не хочет чтобы его парсили. Нужно притворяться пользователем, использовать хорошие заголовки, User-Agent, ip etc...
Ответ написан
Пригласить эксперта
Ответы на вопрос 4
Stalker_RED
@Stalker_RED
Они чувствуют, что это бот, и отдают ему заглушку. Придется вам научиться быть более человечным)
Ответ написан
Комментировать
BRAGA96
@BRAGA96
Ответ написан
Комментировать
irishmann
@irishmann
Научись пользоваться дебаггером
CURL
Ответ написан
Комментировать
@astronotius
Puppeteer. Но не простой, а с набором антиопределителей
  • useragent
  • languages
  • plugins
  • notifications
  • fingerprint
  • etc


Пример работы Puppeteer в режиме headless: false
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы