Задать вопрос
@Twindo

Архитектура приложений типа datanyze.com?

Как организованна архитектура в таких проектах как www.datanyze.com (приложение занимается тем, что обходит миллионы сайтов ежедневно и собирает информацию по технологиям, которая на этих сайтах используется) и т.п.

Интересует как архитектура в целом, так и конкретные моменты: работа с сетью (используются ли iocp (for windows)или epoll (для *nix) или какие-либо другие технологии), работа с БД (какая БД лучше подойдет для таких задач), фрэймворки для организации заданий и их мониторинг, перезапуск заданий после аварийного завершения и т.п.

Если у кого-то есть примеры, вообще было бы здорово.
  • Вопрос задан
  • 2471 просмотр
Подписаться 2 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Java-разработчик
    10 месяцев
    Далее
  • Skillbox
    Курс Java-разработчик
    4 месяца
    Далее
  • Нетология
    Java-разработчик с нуля
    12 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
Neuroware
@Neuroware
Программист в свободное от работы время
не понятно кому такая информация нужна " в виде сервиса", ну собрали один раз.. в год , выложили в виде картинки с графиками дальше сервис теряет смысл, но если очень хочется задача не особо сложная, сбор данных в 99% случаев простейший парсинг по "отпечаткам" "технологий", с хранением проблем тоже нет ибо "миллионы сайтов" это 1 табличка с несколькими миллионами строк, любая БД это скушает и не подавится, фрэймвор нужно определять только после того как будет определено что именно он будет делать, для абстрактного коня в вакууме такое не советуют, в простейшем случае для своего фреймворка достаточно написать отдельный класс в управляемой среде (Java\.net), который будет держать выполняемое задание в блоке try и тогда "аварийное завершение" будет невозможно впринципе, т.к. любой крэш будет отлавливаться на уровне менеждера задач, на C# подобный написан строк в 50 максимум.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы