Задать вопрос

PHP или NodeJS использовать для парсера?

Какой ЯП использовать для парсера? Главный критерий - парсер должен быть быстрым. В основном парсится JSON, XML (RSS+Atom), Twitter (через API) и HTML (но не стоит забывать и про частые HTTP-запросы и про запросы в БД).
Что касается библиотек, для NodeJS подразумеваются:
  1. HTML - cheerio
  2. RSS+Atom - node-feedparser или node-parse-rss
  3. JSON - JSON.parse()
  4. Twitter - twit или node-twitter

Для PHP:
  1. HTML - Simple HTML DOM (в том числе PSR-7 реализации: php-simple-html-dom-parser и php-html-parser)
  2. RSS+Atom - rss-php
  3. JSON - json_decode()
  4. Twitter - twitter-api-php

Если вы можете предложить свои более производительные и т.п. библиотеки или порекомендовать какую-то библиотеку из "или" - пишите
  • Вопрос задан
  • 2434 просмотра
Подписаться 12 Оценить Комментировать
Решения вопроса 6
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
DangelZM
@DangelZM
Для парсера я бы выбрал Go lang.
То как быстро вы получите ответ из HTTP запроса зависит от сервера который будет отдавать страницу. То есть с вашей стороны язык в этом вам не поможет.
По поводу же обработки ответа или же возможности обработки одновременно нескольких ответов тут уже есть разница.
Ответ написан
Комментировать
Tpona
@Tpona
Ужасный перфекционист
Я бы предложил использовать nodejs, мне кажется, проще будет нагрузку регулировать, хотя, с прямыми руками без разницы))
Ответ написан
Комментировать
Revencu
@Revencu
Попробуй PYTHON (LXML + REQUESTS)

Смотри бенчмарк
Ответ написан
Комментировать
Я бы выбрал Python. Как-то исторически уложилось, что для каких задач его используют нас.
Ответ написан
Комментировать
Nodejs будет быстрее если вы умеете на нем писать, потому что во первых без браузерного DOM js очень быстрый (если правильно писать), и можно использовать модули написанные на С++ ,к примеру для парсинга XML https://github.com/astro/node-expat
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
@deadmemoras
Вот вы представьте:
У Вас есть блог написанный на java(используя фреймворк конечно) и вы внедряете какой-то простенький функционал на php.
Вот у Вас аналогично.
Оба языка подходят отлично, если вы пишите чисто парсер (больше ничего не будет) - можете и не читать мой комментарий)
Ответ написан
LightAir
@LightAir
LA
Я бы лучше делал на PHP. На сколько я знаю у ноды проблемы с mysql.
Но c оговоркой, я бы делал back часть на PHP.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы