• Как обрабатывать и хранить огромное количество tracking-запросов?

    @ozket
    Если требуется одновременно и отслеживание событий в реальном времени и аналитика на основе исторических данных, то рекомендую посмотреть на Lambda Architecture. В ней выделяются две части: не-реляционная «batch»-часть (на Hadoop, например) и потоковая, называемая «speed».
    Если такой необходимости нет, то подойдет и связка из очереди (Kafka, например, или data collector вроде Flume и Fluentd), хранилища (ClickHouse, Cassandra, HBase) и средств аналитики (Spark, Impala, ElasticSearch).

    Выбирайте, пробуйте.