Задать вопрос

PHP или NodeJS использовать для парсера?

Какой ЯП использовать для парсера? Главный критерий - парсер должен быть быстрым. В основном парсится JSON, XML (RSS+Atom), Twitter (через API) и HTML (но не стоит забывать и про частые HTTP-запросы и про запросы в БД).
Что касается библиотек, для NodeJS подразумеваются:
  1. HTML - cheerio
  2. RSS+Atom - node-feedparser или node-parse-rss
  3. JSON - JSON.parse()
  4. Twitter - twit или node-twitter

Для PHP:
  1. HTML - Simple HTML DOM (в том числе PSR-7 реализации: php-simple-html-dom-parser и php-html-parser)
  2. RSS+Atom - rss-php
  3. JSON - json_decode()
  4. Twitter - twitter-api-php

Если вы можете предложить свои более производительные и т.п. библиотеки или порекомендовать какую-то библиотеку из "или" - пишите
  • Вопрос задан
  • 2437 просмотров
Подписаться 12 Оценить Комментировать
Решение пользователя Emil Revencu К ответам на вопрос (8)
Revencu
@Revencu
Попробуй PYTHON (LXML + REQUESTS)

Смотри бенчмарк
Ответ написан
Комментировать