как лучше организовать контейнер для хранения IP адресов (1-3Mb)

Question

Александр @akalend

программирую

Алгоритмы

как лучше организовать контейнер для хранения IP адресов (1-3Mb)

для организации кеша IP адресов нужно готовое решение или эффективный алгоритм быстрого доступа к данным ( что-то типа хеш таблиц)
данные могут устаревать, необходимо хранить время последнего доступа.
должно быть предусмотрена чистка или вытеснение не актуальных данных
что в этом случае лучше?
частота обращения высокая (200-300 запросов в сек)!

решение должно быть похожим на мемкеш
быстрым и эффективным!

вход IP — 32-bit число
выход — не более 64 байт — данные фиксированного размера
доп параметр — время доступа

Цель — проверить время последнего доступа.

возможные варианты:
1)
не хотелось бы для вытягивания информации об IP, сканировать всю таблицу адресов.
в этом случае вставка нового IP — вставка в пустой слот данных, вместо первого просроченного слота.
2)
упорядочивание по IP из-за высокой частотностностью обращения не подходит (а может подходит???).
ищем IP методом половинных делений. Если не нашли — вставляем. Какую модель хранения слотов использовать в этом случае?
3)
организовавыть очередь по времени доступа — получается скан всей (части начинающейся с первого не просроченного IP — до него — метод половинных делений) таблицы адресов.
дописываем в конец.

какие есть еще варианты????

Вопрос задан более трёх лет назад
2760 просмотров

3 комментария

Подписаться 4 Оценить 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля + нейросети

9 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 7

1 комментарий

5 комментариев

Александр @akalend Автор вопроса

это мы даже хотим использовать
просто пока не решили как оптимальней

Написано более трёх лет назад
Павел Загребелин @Zagrebelion

Стоит ли в 2010 году делать приложение, которое стойко уверено в четырёхбайтовости ip-адреса?

Написано более трёх лет назад
eternals @eternals

> Стоит ли в 2010 году делать приложение, которое стойко уверено в четырёхбайтовости ip-адреса?
О! Обнаружен интеллект!
Я бы только добавил, что уже почти в 2011-м.

Написано более трёх лет назад
amc @amc

Товарищи интеллектуалы, а вы уверенны что там будет v6?

Написано более трёх лет назад
amc @amc

Тем более автор указал, какой битности у него будет адрес :)

Написано более трёх лет назад

5 комментариев

Dervish66 @Dervish66

Упс, предполагалось что это будет комментарий к предыдущему ответу. Извините.

Написано более трёх лет назад
Александр @akalend Автор вопроса

Вытеснение тоже реализуется довольно просто: по индексу времени доступа находим слот с самым минимальным значением времени доступа (самый давнишний) и заменяем в нем все поля. При этом, конечно, придется обновить оба индекса.

думаю это частая, но тяжелая операция
надо будет как-то запускать ее по реже
например по таймауту…

Написано более трёх лет назад
Александр @akalend Автор вопроса

Обновление индекса можно сделать через удаление индексной записи и добавление новой.
вставка в данном случае операция тяжелая???

Написано более трёх лет назад
Dervish66 @Dervish66

А зачем Вам вообще нужно вытеснение?

Вставка в двоичное сбалансированное дерево — довольно дешевая операция. Расход времени на добавление нового узла в это дерево состоит из двух частей: поиск места для вставки нового узла и балансировка дерева после вставки. Поиск места по расходу времени примерно аналогичен методу половинных делений, а балансировка дерева состоит в переназначении некоторых указателей в дереве. Дешево и сердито.

Аналогично и с удалением: расходы на удаление состоят из поиска удаляемого элемента, operator delete и балансировка дерева после удаления.

Вообще по сбалансированным деревьям можно почитать уйму материалов в интернете начиная со статей на Хабре и заканчивая Википедией. А в гугле можно найти и реализацию этих деревьев.

Написано более трёх лет назад
Александр @akalend Автор вопроса

спасибо
про деревья я в курсе, но присматрюсь к ним повнимательней!

Написано более трёх лет назад

2 комментария

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 315 просмотров
0

ответов
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 385 просмотров
3

ответа
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 217 просмотров
1

ответ
Алгоритмы

Простой
Какие данные берет функция для генерации случайного числа?
- 1 подписчик
- 18 февр.
- 277 просмотров
4

ответа
C++

+1 ещё

Простой
Почему не решает задачу?
- 1 подписчик
- 05 февр.
- 425 просмотров
1

ответ
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт. 2025
- 401 просмотр
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт. 2025
- 293 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 250 просмотров
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт. 2025
- 234 просмотра
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт. 2025
- 390 просмотров
1

ответ
Показать ещё Загружается…

Простите, на каком языке решается задача? Я правильно понял, что речь идет о С++?
задача будет решаться на С
но это не принципиально
нужен алгоритм
в качестве примера можно использовать и С++
можно найти исходники аналогов STL контейнеров

Answer 1 · 2010-12-15 16:08:14

К одним и тем же данным Вам нужно обращаться двумя способами. Один способ — по IP, второй — по времени доступа. При этом необходимо чтобы поиск изменения в данных (смена IP в слоте данных и смена времени доступа) выполнялись быстро и эффективно.

Я бы решал эту задачу отделив сами данные (массив слотов) от индексов, через которые нужно обращаться. Если брать реализацию на С++ то примерно вот так:

// Описатель слота данных
struct CDataItem {
    __int64 accessTime; // Любое представление времени
    DWORD ip;
    BYTE  userData [64];
};

// Индекс по IP
std::map<DWORD, CDataItem *> ipIndex;

// Индекс по времени доступа
std::map<__int64, CDataItem *> accessIndex;

// Память для хранения массива слотов
CDataItem * dataArray = new CDataItem[32000];

При этом, конечно, после каждого изменения (обновления) слота придется обновлять индексы.

Answer 2 · 2010-12-15 16:40:45

amc @amc

Не забывайте что IP адрес прекрасно представляется как 4-байтное число.

Ответ написан более трёх лет назад

5 комментариев

Answer 3 · 2010-12-15 16:45:17

Вряд ли найдется контейнер, который обеспечивал бы эффективный доступ к данным сразу по двум индексам. Зато вместо std::map можно использовать что угодно, например, сбалансированные деревья, тем более что код будет писаться на С. Главная идея моего предложения — разнести индексы и сами данные. Тогда издержки на поиск слотов, вставки слотов и апдейтов индексов можно постараться свести к минимуму.

Вытеснение тоже реализуется довольно просто: по индексу времени доступа находим слот с самым минимальным значением времени доступа (самый давнишний) и заменяем в нем все поля. При этом, конечно, придется обновить оба индекса.

Обновление индекса можно сделать через удаление индексной записи и добавление новой.

Answer 4 · 2010-12-15 15:09:13

shsmad @shsmad

а чем собственно не подошел описаный вами же memcached?

Ответ написан более трёх лет назад

2 комментария

Answer 5 · 2010-12-15 20:31:57

Если типовые инструменты нельзя использовать, то постройте простейшее бинарное дерево. Лочить при перестроении отдельные ноды.

Answer 6 · 2010-12-16 03:23:23

catap @catap

Смесь LRU кеша и какого-нибудь radix32 дерева

Ответ написан более трёх лет назад

1 комментарий

Answer 7 · 2010-12-17 20:35:57

заинтересованным, решил делать так:

поиск по IP структура в виде b-Tree
далее проверка на время
времена хранятся в ввиде обратного списка
вытесняется самый последний в очереди.

При обновлении IP — переносим значение эл-та в конец списка.

как лучше организовать контейнер для хранения IP адресов (1-3Mb)

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт