xmoonlight
@xmoonlight
https://sitecoder.blogspot.com

Какой недорогой сервер для crawler-а посоветуете?

Всем привет.
Планируется сделать пул crawler-ов для сбора веб-данных в БД.
Пока денег не особо много, но нужно начинать с чего-то...
1. Какую архитектуру посоветуете?
2. Что должно быть на сервере (hard&soft), чтобы затем можно было масштабировать решение?
3. Конфиг железа и форм-фактор?
(Изначально планируется 1 сервер, затем - по-мере нагрузки...)
Спасибо.
  • Вопрос задан
  • 2772 просмотра
Решения вопроса 1
@SilentFl
Для себя пришел к выводу использовать RabbitMQ в виде кластера для постановки задач, и простому парсеру на Golang/Ruby/Python, который взаимодействует с кроликом, и зависит только от локального инстанса кролика. Результат парсер может записывать уже в БД.
В таком виде есть возможность масштабирования (добавляем ноду кролика, запускаем парсер и все), есть устойчивость (это забота кролика; парсер, если не может обработать задание, просто не отсылает Ack), простой деплой.
Прототип на Golang можно посмотреть здесь
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы