@MrFrumpuSs

Как лучше писать парсер (PHP)?

Нужно написать парсер который будет проходиться по страницам новостного сайта и парсить статьи вместе с их содержимым.
Что лучше всего использовать для парсинга, DiDOM подойдет?
Так же, как следует писать парсер чтобы не было ошибки 500?
  • Вопрос задан
  • 134 просмотра
Пригласить эксперта
Ответы на вопрос 2
@rPman
Современный веб это больше про javascript а не про генерацию страниц на бакэнде (а часто и то и другое), плюс для анализа сайта бывает проще работать с dom в браузере, открыв страницу и синжектив свой код например с помощью tempermonkey или с помощью selenium

Так что все зависит от твоего целевого сайта

По теме, если прямо надо парсить html именно на php то я рекомендую simple_html_dom, простой удобный... но он спасовал со страницами aliexpress (этот сайт борется с парсерами, даже если брать страницу уже после javascript), можно пользоваться более низкоуровневым DOMDocument::loadHTMLFile, он не такой удобный но менее строгий
Ответ написан
Комментировать
karabanov
@karabanov
Системный администратор
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы