Собственно встал вопрос выбора субд/оптимизации текущей.
сейчас все хозяйство крутится на mysql.
за 3 месяца одна табличка разрослась до 7гб, (innodb) выборка происходит очень долго.
в ней сохраняются все переходы по рекламе. дальше объем будет больше.
структура на данный момент такая: id, campaign, banner, user, date, utm_source, utm_campaign & etc.
при выборке по произвольной дате (например за месяц) и группировке по полям campaign, banner, user, date выборка делается от 30 секунд и более.
индекс: date, campaign, banner, user
попробовал партировать все на монгу, результат не сильно лучше. учитывая что я не переносил данные о utm метках. примерно 6-10сек.
данные необходимо хранить минимум 3 месяца, в идеале пол года.
остальные данные суммируются и заносятся в сводную таблицу, но тут все просто и вопросов нет.
у кого был опыт, поделитесь. ссылки на статьи по теме приветствуются.
Алексей: оптимизируйте то, с чем есть проблемы. Конкретно вашу проблему база данных сама по себе не решит. Вопрос в модели данных, как вы это дело храните, какие выборки вам надо делать. Вам надо оптимизировать количество записей которые нужно обходить при выборках. А это индексы, агрегации, и тд.
Сергей Протько: группировки могут быть почти по всем полям, дата, кампания, баннер, пользователь, utm метки. я всю голову уже сломал как лучше все это хозяйство хранить. читаю сутками. но пока найти идеальный вариант не получается. за сим и пришел за советом.
даже простая выборка как в примере (без учета меток), вызывает проблемы.
если есть ссылочки на материал по теме, с радостью почитаю. проблему нужно решать.