Каково лучшее решение для хранения и выборки по логам (≈ 1 000 строк/сек)?

Question

velikan5 @velikan5

Каково лучшее решение для хранения и выборки по логам (≈ 1 000 строк/сек)?

Приветствую, товарищи!

Есть сервер nginx, на него приходит порядка 500 - 1 500 запросов в секунду.
Вот для каждого из этих запросов я хочу сохранять время и несколько своих параметров.

И всё бы хорошо, если бы не нужно было это ещё и группировать по минутам/часам/дням и уметь показать юзеру, как сгруппированное, так и простынёй.
Что-то подобное обычному access log, только с возможность группировки и адекватной выдачи.

Если вдруг кто-то сталкивался с подобным и может поведать истории успеха - буду благодарен.

Всем успехов и болейте за наших!

Вопрос задан более трёх лет назад
3668 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack-разработчик на Python

14 месяцев

Далее
Яндекс Практикум

Python-разработчик буткемп

4 месяца

Далее
Академия Eduson

DevOps-инженер

7 месяцев

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Nginx

+1 ещё

Простой
Как настроить перенаправление запроса через ingress внутри k8s?
- 1 подписчик
- вчера
- 49 просмотров
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 82 просмотра
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 251 просмотр
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 186 просмотров
2

ответа
Nginx

+2 ещё

Простой
Контейнер rabbitmq docker стартует раньше чем сервис nginx. Как указать согласованность запуска?
- 6 подписчиков
- 26 окт.
- 961 просмотр
4

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 200 просмотров
2

ответа
Nginx

Простой
Как определить картинку: Встроена в страницу или прямая ссылка?
- 1 подписчик
- 16 окт.
- 210 просмотров
1

ответ
Nginx

Простой
Откуда nginx берет главную страницу сайта в моем случае?
- 1 подписчик
- 15 окт.
- 207 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 253 просмотра
4

ответа
Nginx

+1 ещё

Средний
Почему файл PHP в подпапке скачивается а не выполняется(NGINX)?
- 1 подписчик
- 11 окт.
- 181 просмотр
0

ответов
Показать ещё Загружается…

Go-разработчик / Backend Developer (Golang)

Karma8

До 500 000 ₽

SRE/DevOPS инженер

Karma8

До 500 000 ₽

Backend-разработчик (Laravel/PHP) — Middle+/Senior

РПК Discovery • Екатеринбург

от 140 000 ₽

Answer 1 · 2014-02-19 00:33:22

Я бы в вашем случае прикрутил некоторый промежуточный буфер.
Если писать сырые данные напрямую в БД есть риск из тормозов БД залочить\затормозить пишущего, либо просто напросто потерять логи.
Мы в аналогичных задачах ставили буфер в виде redis и писали и читали ключи из объекта LIST с помощью команд RPUSH \ LPOP.
Таким образом если происходил всплеск количества логов (появление "горячего" контента на портале), и они не успевали записываться в базу мы видели лишь увеличение количества записей в очереди, и то, что данные поступающие на анализ, несколько "староваты". При этом сами данные не терялись, и ни одна из сторон не лочилась.

Если не боитесь оверхеда в 30% на хранении данных и новых продуктов, берите связку logstash + elasticsearch + kibana.
При помощи logstash читаете лог, парсите его на лету выцепляя только нужные части и отправляете в ES, который все это дело индексирует и складывает с таймстемпами.
А kibana дает красивенький интерфейс для просмотра, с графиками \ круговыми диаграмами и т д.

Answer 2 · 2014-02-18 21:28:54

Отротированные логи парсите и вливаете в любую удобную для вас БД. А уж из БД делаете выборки какие сами захотите. Только не храните всё в одной таблице, разбивайте по суткам.

Answer 3 · 2014-02-18 21:57:24

Думаю, что так и поступлю. Попробую прикрутить MySQL например.
Интересно только, справится ли он с 2000 инсёртов в секунду?

Каково лучшее решение для хранения и выборки по логам (≈ 1 000 строк/сек)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт