Как проанализировать количество одновременных звонков в определенную минуту?

Question

Leks @Leksnsk

Как проанализировать количество одновременных звонков в определенную минуту?

Добрый день.

Есть задача понять количество одновременных вызовов в определенную минуту времени имея логи вида:

11:02:25 250
11:02:14 60
11:03:08 33
11:03:10 99

Где 11:02:25 время соединения, 250 - длительность.
Естественно логов очень много, более 500 в минуту может быть. Решения типа Exel не подходят. Хотелось бы автоматизировать с помощью bash или python. На выходе надо иметь число - например, 5 одновременных в минуту 11:02.

Вопрос задан более трёх лет назад
1338 просмотров

9 комментариев

Подписаться 4 Оценить 9 комментариев

d'Ivan @2ord

Обычный текстовый файл или в СУБД?

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

Роман: Обычный текстовый, могу конечно положить в mysql базу, но это будет сложнее,т.к в БД дело почти не имел.

Написано более трёх лет назад
d'Ivan @2ord

Задача легко решается на языка SQL. Есть разные СУБД. Из самых простых - SQLite. Импортировав в БД, можно производить выборки при помощи SQL на любом языке, включая пайтон.

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

Спасибо за совет, как дойду до изучения sql, попробую решить эту задачу с помощью sql. Пока чувствую моих знаний не достаточно.

Написано более трёх лет назад
d'Ivan @2ord

Leks Freeman, без SQL будешь изобретать велосипеды, как сделал это Андрей. Зачем оно тебе надо?
Начни лучше с zetcode.com/db/sqlitepythontutorial

Кстати, а почему нужна именно поминутная статистика, а не, скажем, почасовая?

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

Дальнейшая задача, на основе полученных данных строить графики загрузки, поэтому нужно знать сколько одновременных вызовов было в конкретную минуту.
Ссылку изучу, не исключено, что в дальнейшем правильнее будет хранить логи в БД.

Написано более трёх лет назад
d'Ivan @2ord

Leks Freeman: Такая дикая точность врядли оправдана. Такая точность будет показывать только шумы: вспомни про графики скачков курсов валюты - то же самое и здесь. Но это уже не мне решать, конечно.

Написано более трёх лет назад
Андрей @OLS

Роман: Точность подсчета высоких значений гистограмм нужна на практике, когда подсчитывают, сколько соединительных линий от городской АТС приобретать, чтобы абоненты на занятость из-за недостаточной пропускной способности стыка не попадали.

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

Андрей да, для этого все и затевается.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Аналитик данных + стажировка

6 месяцев

Далее
Бруноям

ИИ-агенты и n8n

2 месяца

Далее

Решения вопроса 1

4 комментария

angru @angru

правда работает только для значений интервала не больше 60

Написано более трёх лет назад
angru @angru

хотя можно выставить интервал в одну секунду и получится примерно как у Андрей

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

Спасибо, ушел понимать что есть что) Интересно будет разобрать Ваше решение и немного пайтон подучить, только начинаю программирование изучать.

Написано более трёх лет назад
angru @angru

удачи, только на больших данных и маленьких интервалах не используйте print или pprint - подвесит вам интерпретатор, лучше в файл результат сохранять.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 4

3 комментария

Андрей @OLS

Тоже очень хороший метод. Однозначно, более быстрый через мой вариант. Единственное, по нему гистограммы количества занятых линий почасовые тяжело будет строить - в смысле нужно будет много и внимательно написанного кода - а передо мной еще и эта задача стояла.

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

С графиками проблем быть не должно. Если будет два значения - минута и количество звонков, просто скормлю данные заббиксу.

Написано более трёх лет назад
d'Ivan @2ord

Leks Freeman: zabbix как-бы немного из другой области, если что.

Написано более трёх лет назад

Комментировать

3 комментария

Leks @Leksnsk Автор вопроса

В вопросе не указал, мне не столько интересно готовое решение, сколько мысли по поводу того как подобное реализовать, хотел бы итоговое решение сделать самостоятельно.
Пока у меня мысли только в направлении - разбить минуту на интервалы, по 5,10 или 30 секунд (в зависимости от точности которую хочу получить), далее для каждого звонка понять попадает ли он в заданный интервал. И посчитать количество таких таких звонков, которые попали.
Но может кто-то может подсказать более изящное решение.
Спасибо, за предложение.

Написано более трёх лет назад
Андрей @OLS

Leks Freeman: Я решал именно так же. Массив из 86400 значений счетчиков (для каждой секунды в сутках), далее проход по файлу лога с увеличением этих счетчиков, и затем анализ максимумов в интересующем периоде - даже для выч.мощностей 2002 года, когда я это писал, была молниеносная задача.

Написано более трёх лет назад
Leks @Leksnsk Автор вопроса

Значит этим путем и пойду. Благодарю.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Карьера в IT

+1 ещё

Средний
Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?
- 5 подписчиков
- 25 июн.
- 1188 просмотров
6

ответов
Информационная безопасность

+3 ещё

Простой
Утечка кейвордов в Телеграм при посещении постороннего сайта?
- 3 подписчика
- 03 июн.
- 330 просмотров
3

ответа
IT-образование

+2 ещё

Средний
Бизнес и системный аналитик: кто это?
- 2 подписчика
- 29 мая
- 445 просмотров
4

ответа
Системное администрирование

+1 ещё

Простой
Что может значит «Количество SIP линий» в облачной АТС в настройках SIP-аккаунта (фото прилагается)?
- 2 подписчика
- 29 апр.
- 283 просмотра
2

ответа
VoIP

+1 ещё

Простой
Dinstar dag1000-8 s как настроить?
- 1 подписчик
- 20 апр.
- 88 просмотров
1

ответ
VoIP

+2 ещё

Простой
Как настроить BLF от ОАТС BeeLine на Yealink?
- 1 подписчик
- 10 апр.
- 102 просмотра
1

ответ
Аналитика

Средний
DAX \ Power BI как сделать меру через промежуточную таблицу?
- 2 подписчика
- 08 апр.
- 76 просмотров
1

ответ
Телефония

+2 ещё

Средний
АТС Grandstream, как завести FXO?
- 1 подписчик
- 11 февр.
- 194 просмотра
1

ответ
Телефония

+2 ещё

Средний
Как реализовать инициализацию звонка через Телфин?
- 1 подписчик
- 16 янв.
- 97 просмотров
1

ответ
Аналитика

Средний
Как структурировать работу над новым проектом в бизнес аналитике. Какая очередность у всего процесса аналитики?
- 1 подписчик
- 15 янв.
- 148 просмотров
1

ответ
Показать ещё Загружается…

Обычный текстовый файл или в СУБД?
Роман: Обычный текстовый, могу конечно положить в mysql базу, но это будет сложнее,т.к в БД дело почти не имел.
Задача легко решается на языка SQL. Есть разные СУБД. Из самых простых - SQLite. Импортировав в БД, можно производить выборки при помощи SQL на любом языке, включая пайтон.
Спасибо за совет, как дойду до изучения sql, попробую решить эту задачу с помощью sql. Пока чувствую моих знаний не достаточно.
Leks Freeman, без SQL будешь изобретать велосипеды, как сделал это Андрей. Зачем оно тебе надо?
Начни лучше с zetcode.com/db/sqlitepythontutorial

Кстати, а почему нужна именно поминутная статистика, а не, скажем, почасовая?
Дальнейшая задача, на основе полученных данных строить графики загрузки, поэтому нужно знать сколько одновременных вызовов было в конкретную минуту.
Ссылку изучу, не исключено, что в дальнейшем правильнее будет хранить логи в БД.
Leks Freeman: Такая дикая точность врядли оправдана. Такая точность будет показывать только шумы: вспомни про графики скачков курсов валюты - то же самое и здесь. Но это уже не мне решать, конечно.
Роман: Точность подсчета высоких значений гистограмм нужна на практике, когда подсчитывают, сколько соединительных линий от городской АТС приобретать, чтобы абоненты на занятость из-за недостаточной пропускной способности стыка не попадали.
Андрей да, для этого все и затевается.

Answer 1 · 2015-09-10 14:11:01

интересная задачка, у меня получилось как-то так. решал для себя, но вдруг пригодится:

# -*- coding: utf-8 -*-
from pprint import pprint
from datetime import datetime, timedelta
from collections import defaultdict


INTERVAL = 15


assert 0 < INTERVAL <= 60, "алгоритм работает не совсем корректно при значениях интервала больше 60"


def get_time_list(start, end, interval):
    """
        Список "времен" в которые попадает звонок
    """
    t = start + timedelta(seconds=(interval - ((start.second % interval) or interval)))  # стартовое время в которое попадает звонок с учетом интервала
    res = []

    while t.time() <= end.time():  # используем .time() т.к. если сравнивать datetime можно перейти на следующий день
        res.append(t.time().isoformat())

        t = t + timedelta(seconds=interval)

    return res


with open('calls.log', 'r') as f:
    res = defaultdict(int)

    for line in f.readlines():
        start_time, duration = line.split()
        start_time = datetime(1, 1, 1, *map(int, start_time.split(':')))  # используем datatime вместо time, потому что к time нельзя прибавить timedelta
        end_time = start_time+ timedelta(seconds=int(duration))
        time_list = get_time_list(start_time, end_time, INTERVAL)

        for t in time_list:
            res[t] += 1

    pprint(res)

результат на вашем наборе:

{'11:02:15': 1,
'11:02:30': 2,
'11:02:45': 2,
'11:03:00': 2,
'11:03:15': 3,
'11:03:30': 3,
'11:03:45': 2,
'11:04:00': 2,
'11:04:15': 2,
'11:04:30': 2,
'11:04:45': 2,
'11:05:00': 1,
'11:05:15': 1,
'11:05:30': 1,
'11:05:45': 1,
'11:06:00': 1,
'11:06:15': 1,
'11:06:30': 1}

Answer 2 · 2015-09-10 12:28:28

Преобразуете список звонков в список содержащий 2 поля - время, тип события. Типов события два - начало звонка, завершение звонка. Сортируете этот список по столбцу времени. Проходите последовательно по этому списку и в счетчик заносите +1 если событие начала звонка, и -1 если завершение звонка. Сравниваете значение счетчика с предыдущим значением, сохраняете максимум и время соответсвующего события. Так можно находить максимумы не только в пределах суток, но и в любом диапазоне времени.

Answer 3 · 2015-09-10 12:46:54

Я бы такое сделал на перл или питон, но не на баш. Большой массив и неудобно с кроссплатформенностью.

Просто проходите по всем строкам и инкрементируете в массиве, разбитом по минутам, все ваши звонки.
Затем в конце формируете отчет по массиву.

Answer 4 · 2015-09-10 10:57:08

Могу отдать свой старый исходник на Делфи и скомпилированный код именно под эту задачу.
Только в ответе будет максимальное одновременное количество занятых линий в минуту/час.
Если интересно - укажите e-mail

Answer 5 · 2015-09-10 12:44:34

"Логи" лучше сразу сохранять в СУБД, если это возможно. Скажем, если какая-то программа выводит данные в stdout, то другой программой можно собирать их и сразу записывать в SQLite/MySQL.
Допустим, так: call_center | sql_collector.
А аналитика сама "приклеется", имея механизм доступа к БД.

Пишется несложный SELECT запрос c использованием GROUP BY, COUNT. Затем полученную выборку анализирует умная программа-анализатор.

Как проанализировать количество одновременных звонков в определенную минуту?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт