Здравствуйте, друзья.
Есть компания, которая продаёт просмотры баннеров в Интернете.
За всё время в логе накопилось 300 млн. записей. Лог состоит из следующих записей:
- id пользователя (хеш-код)
- дата просмотра
В последнее время за сутки в лог-файл добавляется 10 млн. записей. Каждый пользователь за всё время делает от 10 до 100 просмотров, если смотреть по медиане.
Требуется сделать систему, которая за время меньше 1 сек. выдаёт количество уникальных пользователей, которые просматривали баннеры.
Максимальный промежуток дат — 3 года, минимальный — 1 день, сегодняшнюю дату запрашивать нельзя. На компьютере бесконечный HD, 2 ядра процессора, 4 Гб ОЗУ.
С помощью каких технологий можно это реализовать?