kayart
@kayart
Freelancer, Web-Developer

Парсинг на PHP в 2018/2019?

В JavaScript для задач парсинга в большинстве случаев используют ровно два инструмента:

1) Puppeteer - там, где необходимо эмулировать действия браузера
2) cheerio - там, где достаточно просто распарсить HTML-документ

У меня, как у человека достаточно далёкого от трендов в мире PHP, возник вопрос - а какие инструменты сегодня принято использовать для подобных задач? Буду очень благодарен, если вы расскажете мне об альтернативах как для Puppeteer, так и для cheerio
  • Вопрос задан
  • 3690 просмотров
Пригласить эксперта
Ответы на вопрос 3
In4in
@In4in
°•× JavaScript Developer ^_^ ו°
Используйте Python) Ведь используя Python, вы можете парсить в несколько потоков и без заморочек (скрытая реклама python, ведь python это круто)

Ну а если говорить про инструменты парсинга на PHP, то лично мне хватает SimpleDomHTML (банальный парсинг html-страниц), а все мои коллеги сидят на PhantomJS (дополнительная эмуляция JavaScript)
Ответ написан
OnYourLips
@OnYourLips
Асинхронно делайте.
ReactPHP https://sergeyzhuk.me/2018/03/19/fast-webscraping-...

Еще лучше - асинхронно и многопроцессно, используя очереди (RabbitMQ).
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы