Какую архитектуру выбрать для системы учета кликов?

Question

mediadata @mediadata

Анализ web-трафика

Какую архитектуру выбрать для системы учета кликов?

Перед нами стоит задача создания распределенного трекера для учета кликов, который будет использоваться для пост-анализа рекламных кампаний (ppc).

Сложность в том, что рекламные кампании проводятся по всему миру, поэтому в системе необходимо иметь несколько серверов наиболее близких к конечному пользователю для исключения лишних потерь. При этом все клики должны скапливаться в единое хранилище, с которым будет работать система аналитики. Максимальная нагрузка на каждой локации - 1-2 миллиона кликов в сутки.

Пока мы абстрактно представляем себе такой вариант - в каждой локации размещается средний по производительности сервер, его задача сводится только к тому, чтобы обработать клик (простейшие правила на основании IP и User Agent-а) , сохранить его данные и передать их "выше". Также необходим мощный сервер, который призван агрегировать данные и на котором будет размещаться сама система аналитики и хранилище.

Быстродействие "принимающих" серверов очень критично, а сервер-агрегатор будет использоваться лишь для выборок и маркетинговой аналитики, поэтому его быстродействие не в первом приоритете.

Вопрос в том, какие современные технологии лучше выбрать для подобной системы? Как лучше построить техническую часть передовых серверов, сервера аналитики и, главное, как организовать передачу данных с принимающего сервера на аналитический, чтобы не страдало быстродействие и обработка кликов? Возможно, кому-то попадались подобные кейсы, будем благодарны за ссылки.

Решение только для внутреннего использования.

Все огромное спасибо за идеи

Вопрос задан более трёх лет назад
169 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анализ web-трафика

Простой
Как работает отслеживание количества открытых вкладок?
- 1 подписчик
- 15 июн.
- 137 просмотров
2

ответа
Google Analytics

+1 ещё

Простой
Как настроить яндекс метрику для сбора time spent под пользователя по userId?
- 1 подписчик
- 28 апр.
- 42 просмотра
1

ответ
Анализ web-трафика

+2 ещё

Простой
Каким образом провайдер мониторит мой трафик?
- 5 подписчиков
- 14 янв.
- 17767 просмотров
5

ответов
Анализ web-трафика

Средний
Может ли РКН блокировать конкретный URL?
- 1 подписчик
- 27 дек. 2024
- 293 просмотра
3

ответа
JavaScript

+4 ещё

Сложный
Почему в WebSockets History в Burp Suite отображаются кракозябры?
- 1 подписчик
- 21 дек. 2024
- 206 просмотров
2

ответа
C++

+3 ещё

Простой
Как перенаправлять весь траффик на определенный сайт через прокси сервер с помощью C/C++?
- 3 подписчика
- 20 нояб. 2024
- 270 просмотров
1

ответ
Парсинг

+2 ещё

Простой
Может ли сервер обнаруживать использование MITM Proxy/Burp Suite?
- 1 подписчик
- более года назад
- 144 просмотра
1

ответ
Windows

+2 ещё

Простой
Для Windows 10 какой браузер по умолчанию использует меньше трафика?
- 1 подписчик
- более года назад
- 524 просмотра
2

ответа
Веб-разработка

+2 ещё

Простой
Как правильно читать(видеть) счетчик(рекламную вставку) на сайте? И правильно интерпретировать?
- 1 подписчик
- более года назад
- 72 просмотра
2

ответа
1С-Битрикс

+3 ещё

Средний
Как собирать ЮТМ метки при использовании сократителей ссылок?
- 2 подписчика
- более года назад
- 106 просмотров
0

ответов
Показать ещё Загружается…

Стажер Аналитик

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Специалист поддержки B2B-пользователей (чат и звонки)

SMS Aero

от 50 000 до 60 000 ₽

Кредитный аналитик / Андеррайтер

Wanted • Москва

До 150 000 ₽

Answer 1 · 2016-01-30 12:20:04

На принимающих серверах - nginx. Прямо из него кладём данные в in-memory DB или в очередь используя встроенный lua или javascript (в последней версии nginx). Либо nginx передаёт данные дальше на бэкэнд, в роли которого может выступать что то очень быстрое, вроде eventmachine на ruby, аналоги из python или php, языки nodejs, go. Для БД можно использовать redis, либо если оперативы мало, а данных много, можно mongodb, из которой потом выбирать данные и отправлять в очередь.
Для очередей можно взять что то из RabbitMQ, apache kafka, beanstalk и другие.
На агрегирующих серверах Hadoop или другие модные слова.

Какую архитектуру выбрать для системы учета кликов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт