Как правильно организовать систему хранение большого кол-ва данных (логов, счетчиков)?

Question

Arman @Arik

Как правильно организовать систему хранение большого кол-ва данных (логов, счетчиков)?

Добрый день.

Есть небольшая задача, на которую сегодня можем потратить время для того чтоб завтра не болела сильно голова.
Поэтому пока на бумажке проектируем и хотелось узнать мнение более знающих и опытных людей. Ну или просто может кто посоветует что.

Условия:
- минимум админ. действий с БД, сервером
- большое количество записей
- чтение в основном последние n-записей (~1000), но при этом с условием (что-то вроде: SELECT * FROM tbl WHERE author = 'pabel' ORDER BY `id` DESC LIMIT 100). Тоже очень большое количество операций на чтение, отдаем данные в публичный API
- группировка (записи имеют поля по которым группируем или входят в условие выборки)
- простой полнотекстовый поиск (очень редко, но нужно будет и на разных языках)
- максимальное время жизни. Желательно хранить долго, а это значит что данных в таблице/коллекции будет очень много.

Данные в общем в виде лога http-запросов. Поля: хозяин счетчика, ресурс, данные http и т.д.

Само приложение пока делаем на php, по необходимости узкие места перепишут. А вот где хранить не можем решить. Хочется очень простой и гибкий инструмент, смотрим в сторону Amazon RDS и Amazon DynamoDB. Получается будет огромная очередь на запись и чтение последних n-записей.

С облачным хостингом мы закрываем условие "минимум админ. действий с БД, сервером", т.е. фактически просто добавляем ресурсов. Единственное они сами справляются с нагрузками или надо самим заниматься репликацией БД, если чтение данных будет очень большим?

Если нет особой важности в виде хранения данных (SQL / noSQL), то что лучше справится с нагрузкой RDS или DynamoDB?

Может использовать что-то другое?

Может кто встречал статьи по этому поводу? Посоветуете материал для чтения?

Заранее спасибо.

Вопрос задан более трёх лет назад
3062 просмотра

Комментировать

Подписаться 5 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Системный администратор

6 месяцев

Далее
Skillbox

Системный администратор с нуля

6 месяцев

Далее
Нетология

Системный администратор

11 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 2 подписчика
- вчера
- 359 просмотров
2

ответа
Windows

+1 ещё

Простой
Windows XP активация как решить без потери памяти?
- 2 подписчика
- 27 нояб.
- 534 просмотра
6

ответов
Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 3 подписчика
- 19 нояб.
- 793 просмотра
10

ответов
Windows

+1 ещё

Простой
Удаление кэшированного пароля Windows — как?
- 5 подписчиков
- 14 нояб.
- 694 просмотра
6

ответов
Системное администрирование

+1 ещё

Простой
Актуален ли еще Kaspersky Security для Windows Server 11/12?
- 2 подписчика
- 12 нояб.
- 466 просмотров
3

ответа
Системное администрирование

+2 ещё

Средний
Как победить бесконечную загрузку TLS континент?
- 1 подписчик
- 11 нояб.
- 229 просмотров
1

ответ
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 307 просмотров
1

ответ
Системное администрирование

Простой
Чем заменить AnyDesk?
- 13 подписчиков
- 07 нояб.
- 8611 просмотров
10

ответов
Системное администрирование

+1 ещё

Простой
Какие нужны навыки начинающему junior сис админу и каков его карьерный рост?
- 6 подписчиков
- 23 окт.
- 1285 просмотров
4

ответа
Компьютерные сети

+2 ещё

Простой
Возможно ли вывести изображение с ноутбука на три разных андроид телевизора внутри локальной сети(некий аналог anydesk)?
- 3 подписчика
- 22 окт.
- 542 просмотра
2

ответа
Показать ещё Загружается…

Технический руководитель/Technical Lead(государственная информационная система)

ЛАНИТ • Москва

До 400 000 ₽

Go-разработчик / Backend Developer (Golang)

Karma8

До 500 000 ₽

Системный аналитик

UDS Media • Санкт-Петербург

До 200 000 ₽

Answer 1 · 2015-01-23 11:22:28

index0h @index0h

PHP, Golang. https://github.com/index0h

Elasticsearch
Для логов: some_logs_source > Logstash [ > Redis ] > Elasticsearch > Kibana

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2015-01-24 13:33:20

Соглашусь про Elasticsearch для логов, вместо Logstash можно посмотреть на Graylog2 (не говорю что он лучше, но посмотреть стоит).
По поводу счётчиков и вообще всяческих time series, буквально недавно натыкался на http://influxdb.com, до экспериментов руки не дошли, но учитывая то, что это обычно не такие критичные данные, можно и поиграться.

Как правильно организовать систему хранение большого кол-ва данных (логов, счетчиков)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт