@freeeeez

Как спарсить сайт, созданный на angular?

Сайт написан на angular, т.е. в коде страницы только загружаемые скрипты, если парсить через simple_html_dom или что-то подобное, через Curl то просто получаешь список этих скриптов, тело страницы формируется после загрузки скриптов, но ни file_get_content, ни Curl этого не видят. Как спарсить подобный сайт? На ум приходит только headless chrome, но это достаточно долго, может есть какие-то более простые методы?
  • Вопрос задан
  • 224 просмотра
Решения вопроса 1
Sanasol
@Sanasol
нельзя просто так взять и загуглить ошибку
Сайт на ангуляре/реакте/вью информацию берет не из воздуха, и парсить надо не сайт, а то откуда он эту информацию берет.
В 99% случаев это запросы к API сайта.

Т.е. надо открывать в DevTools вкладку Network при загрузке и посмотреть по каким ссылкам берутся данные.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@historydev
Острая аллергия на анимешников
puppeteer, nightmare - npm
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы