Если требуется одновременно и отслеживание событий в реальном времени и аналитика на основе исторических данных, то рекомендую посмотреть на Lambda Architecture. В ней выделяются две части: не-реляционная «batch»-часть (на Hadoop, например) и потоковая, называемая «speed».
Если такой необходимости нет, то подойдет и связка из очереди (Kafka, например, или data collector вроде Flume и Fluentd), хранилища (ClickHouse, Cassandra, HBase) и средств аналитики (Spark, Impala, ElasticSearch).
Выбирайте, пробуйте.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Если такой необходимости нет, то подойдет и связка из очереди (Kafka, например, или data collector вроде Flume и Fluentd), хранилища (ClickHouse, Cassandra, HBase) и средств аналитики (Spark, Impala, ElasticSearch).
Выбирайте, пробуйте.