@Senseich

Как парсить данные страницы, которые формируются на JS?

Всем привет! Никогда не делал что-то подобное, поэтому могу не точно формулировать. Хочу спарсить лайв статистику для спортивного сайта. Нашел такой сайт

Как я понял, страничка со всеми данными формируется с помощью JS, т.е. при парсинге страницы file_get_contents выдаёт в теле страницы просто JS скрипт.

Возможно ли парсить данные с такого сайта? Если да, то в каком направлении копать. В инете я подобной инфы не нашел, возможно из-за неправильной формулировки.
  • Вопрос задан
  • 174 просмотра
Пригласить эксперта
Ответы на вопрос 3
MvcBox
@MvcBox
Software Engineer [C/C++/JS(for Node.js)/etc]
Для PHP есть обертка над puppeteer
https://github.com/rialto-php/puphpeteer
Ответ написан
Комментировать
alekciy
@alekciy
Вёбных дел мастер
Нужно использовать webdriver и headless режим запуска браузера. Хром это умеет и самое простое сейчас это запустить его в docker пример как тут описано: https://stackoverflow.com/a/60009842 . А дальше можно посылать ему команды и можно делать не только парсинг, но и писать ботов. Управлять лучше через Xpath.

Вот видео с техническими деталями и примерами кода как это может работать: https://www.youtube.com/watch?v=QljcCuKTqGM&list=P...
А тут про XPath если с ним нет опыта: https://www.youtube.com/watch?v=id_MNxmdRvk
Ответ написан
Комментировать
iMedved2009
@iMedved2009
Не люблю людей
можно.
1. Использовать Selenium
2. Смотреть откуда JS берет данные - в этом случае - оно гребет с таких урлов: https://d.livescore.in/ru/x/feed/f_1_0_3_ru_4 посмотреть все эти урлы можно в закладки Сеть в средствах разработчика
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы