В чем можно хранить около триллиона значений key=>value?

Question

v_k @v_k

Базы данных

В чем можно хранить около триллиона значений key=>value?

Собственно, вопрос. Длина ключа - 8 симовлов [a-z-A-Z0-9], длина значения 64 символа [a-f0-9].
В чем можно создать такую базу, чтобы быстро поместить в нее все значения и потом быстро извлекать данные по нужному ключу?

Вопрос задан более двух лет назад
972 просмотра

9 комментариев

Подписаться 9 Простой 9 комментариев

v_k @v_k Автор вопроса

В оперативной памяти такое не сохранишь - денег никаких не хватит.

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, хранение пароля и его хеша

Написано более двух лет назад
v_k @v_k Автор вопроса

Yokaze, слишком медленно вставляются данные, т.е. заполняется таблица

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, решил с того, что у меня такое ТЗ, а как реализовать его - вот главный вопрос.

Написано более двух лет назад
v_k @v_k Автор вопроса

Yokaze, сервер амазоновский 32vcpu, тип носителя - SSD.

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, ту то базу я реализовал на Postgres, пришло время новой базы и хотелось бы ее сделать побыстрее.

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, угу, скорее всего, так и буду делать, только все равно остается открытым вопрос - на какой БД это реализовать пока не зашло все слищком далеко.

Написано более двух лет назад
Сергей Соколов @sergiks

Триллион записей 1e12 vs 8-значный ключ a-zA-Z0-9 = 26+26+10 = 62
62^8 / 1e12 ~= 218.34
Уникальных вариантов ключа всего лишь в 218 раз больше, чем ожидается записей.
Рассматривали варианты коллизий? Что на один ключ («пароль») может претендовать несколько разных значений.

Точно ли нет однозначного способа вычислительно получать длинное значение из короткого «пароля» ?

Написано более двух лет назад
v_k @v_k Автор вопроса

Сергей Соколов, да, при коллизии данные будут обновлены

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер по тестированию

5 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Яндекс Практикум

Java-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 6

12 комментариев

v_k @v_k Автор вопроса

мне главное - это чтобы побыстрее заполнить эту базу, не за месяцы, а где-то дней за 10. При скорости генерации данных - 1м в секунду. Проблема в том, что мне не понятно как сконструировать хранилище, чтобы была такая высокая скорость вставки. Что пробовали: файловая система (хранение в подпапках вида /a/b/c.../a1.txt, скорость вставки получилась медленная, Postgres - тоже медленная скорость).

Может надо сделать распределенное хранилище?

Написано более двух лет назад
mayton2019 @mayton2019

Postgres - тоже медленная скорость

Как ты оптимизировал Postgres. Там тоже должен быть режим batch-insert. Ты его применял?

Написано более двух лет назад
mayton2019 @mayton2019

Что пробовали: файловая система (хранение в подпапках вида /a/b/c.../a1.txt, скорость вставки получилась медленная

Это хорошая идея и ее надо обдумать. Но если вы планируете по 1 файлу на каждый ключ то ваша система лопнет по количеству inodes. А тюнинг ФС до такого уровня количества ключей я еще ни разу не встречал.
И вообще я думаю это плохая практика. ФС будет хранить больше мета-информации на каждый файл чем длина вашего ключа. Именно поэтому эта идея нежизнеспособна. Вы потеряете все терабайты в мету. Можно группировать ключи в файлы-группы но это все - уводит вас в сторону от собственно базы данных. Тогда постановку нужно пересмотреть полностью.

Написано более двух лет назад
v_k @v_k Автор вопроса

mayton2019, batch-insert делаю, да. Проблема, видимо, в том, что никакая отдельно стоЯщая БД не позволит делать 1м вставок в секунду с одним индексом по ключу, поэтому я хочу понять, может мне как-то распределенно построить базу? Например, грубо говоря, взять 1-ый символ, всего 58 вариантов и сделать 58 серверов, на которые будет идти вставка, а поиск по базе будет заключаться в одновременном запросе на все эти сервера.

Написано более двух лет назад
mayton2019 @mayton2019

v_k, вы можете отказаться от ACID и строгой консистентности и поднять например 8 постгресов и таким образом вставлять в разные БД ключи по формуле MOD(8) от ключа. Такое часто бывает в облатси биг-дата где я работаю. Но у нас в биг-дате данные обычно write-only. Исторические.

Вот. А при поисковых операциях вы будете просто очень быстро искать ключ в нужной БД из 8 возможных.

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, у меня немного другая задача: есть пароль, задача по нему найти хеш, а не наоборот.

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, по паролю я не узнаю где он, пароль со своей "солью"

Написано более двух лет назад
rPman @rPman

универсальные базы данных это МЕДЛЕННАЯ ЗАПИСЬ, причем медленная от слова кошмар
они оптимальны там где многопользовательский доступ и есть транзакции, они очень дорогие!

еще советую посмотреть оверхед на индексы у универсальных базах данных, просто на практике, в моем ответе я ссылку кинул на буквально недавно человек на mssql что то похожее пилил

Написано более двух лет назад
v_k @v_k Автор вопроса

v_k, всмысле хеш с солью

Написано более двух лет назад
v_k @v_k Автор вопроса

rPman, спасибо, посмотрю!

Написано более двух лет назад
v_k @v_k Автор вопроса

Dr. Bacon, а ну да, точно, а то я уже запутался

Написано более двух лет назад
mayton2019 @mayton2019

v_k, мне кажется что мы "не с той стороны" начали.
Вот смотри. Ты делаешь акцент на загрузке триллиона records за 10 дней.
А зачем тебе их все вообще грузить? В каком виде они лежат сейчас?
Если это - CSV файлы - то их можно так и положить на какую-нибудь
hdfs-like файловую систему и работать как с большими данными.
AWS athena может работать с ними сразу через SQL никуда даже не
преобразовывая. Spark умеет CSV в датафреймы преобразовывать.
А для скорости надо просто сделать партишенинг хешу от ключа.

А для быстрого ответа построить поврх этой системы Redis. Таким образом
горячие ключи быстро поднимутся в кеш а холодные.... а нафик они нужны.

Вобщем есть миллиард способов как решать эту задачу.

Написано более двух лет назад

3 комментария

v_k @v_k Автор вопроса

а если Cassandra?

Написано более двух лет назад
mayton2019 @mayton2019

v_k, кассандра скорее всего не подходит. Она в основном расчитана на In-Memory Cluster. Дорого и безсмысленно. Будете платить за uptime.

Хотя ее младший брат AWS-Dynamo может стоит рассмотреть. Будет дешевле с точки зрения хранения информации. Кажется там платить надо за фактически вычитанные строки. А за само хранение и за uptime
я не помню. Может и что-то начисляется но мало.

Написано более двух лет назад
Dimonchik @dimonchik2013

v_k, на сайте есть же бенчмарки

Написано более двух лет назад

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 143 просмотра
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 1 подписчик
- 14 окт.
- 187 просмотров
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 306 просмотров
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 433 просмотра
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 203 просмотра
1

ответ
Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 93 просмотра
1

ответ
Node.js

+2 ещё

Простой
Как сделать регистрацию без слета через fs?
- 1 подписчик
- 03 июн.
- 168 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Какую базу данных нужно использовать для телеграмм бота?
- 1 подписчик
- 10 мая
- 4856 просмотров
8

ответов
IT-образование

+1 ещё

Простой
С чего начать изучение инженерной части БД?
- 2 подписчика
- 23 апр.
- 406 просмотров
3

ответа
Python

+2 ещё

Простой
Корректно ли в данном случае отправляется запрос в базу данных?
- 1 подписчик
- 23 апр.
- 214 просмотров
2

ответа
Показать ещё Загружается…

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Менеджер цифровых проектов

Российский Красный Крест • Москва

от 100 000 ₽

Разработчик 1С

Siderus • Москва

от 220 000 до 280 000 ₽

В оперативной памяти такое не сохранишь - денег никаких не хватит.
Yokaze, слишком медленно вставляются данные, т.е. заполняется таблица
Dr. Bacon, решил с того, что у меня такое ТЗ, а как реализовать его - вот главный вопрос.
Yokaze, сервер амазоновский 32vcpu, тип носителя - SSD.
Dr. Bacon, ту то базу я реализовал на Postgres, пришло время новой базы и хотелось бы ее сделать побыстрее.
Dr. Bacon, угу, скорее всего, так и буду делать, только все равно остается открытым вопрос - на какой БД это реализовать пока не зашло все слищком далеко.
Триллион записей 1e12 vs 8-значный ключ a-zA-Z0-9 = 26+26+10 = 62
62^8 / 1e12 ~= 218.34
Уникальных вариантов ключа всего лишь в 218 раз больше, чем ожидается записей.
Рассматривали варианты коллизий? Что на один ключ («пароль») может претендовать несколько разных значений.

Точно ли нет однозначного способа вычислительно получать длинное значение из короткого «пароля» ?
Сергей Соколов, да, при коллизии данные будут обновлены

Answer 1 · 2022-01-01 19:28:24

Давайте прикинем объем который понадобится. Что такое триллион?
Это 12 нулей. Или 1 000 000 000 000 элементов. Какая у нас data-row?
8 + 64 символов типа ASCII (байт подходит чтоб покрыть все символы).
Итого 72 байта на строку. Там можно еще поужимать биты в байтах но только
сложность повышает а большой пользы для дела не дает. Пускай будет ASCII == 1 байт.

Вобщем такой расчет

72000000000000 байтов на весь сегмент данных когда таблица загружена.
Или 65 терабайт. А сколько магнитных блинов надо прикупить? Возьмем популярный магнитный
Western Digital Purple 10TB 7200rpm 256MB WD102PURZ 3.5" SATA III при цене 290$
Порядка 7 штук надо. Вобщем готовте котлету денег 290$ * 7 = 2030$

По поводу DBMS. Да key-value здесь подходит. Можно начинать с LevelDb или RocksDb но у них
расход дисковой памяти на 1 строчку может быть больше чем я посчитал. Я ведь считал эконом-эконом
вариант в виде бинарного типизированного файла где все записи строго по 72 байта. Сколько именно
захватит РоксДб или ЛевлДб - чорт его знает. Вряд-ли документация об этом что-то говорит.
Но берите 1% датасета. Загружайте
и аппроксимируйте сколько выйдет после полной прогрузкуи. Это - надежный способ оценки.

Answer 2 · 2022-01-01 19:59:48

ключ 49 бит - log(66^8) - пусть для простоты 8байт, значение 32 байта (у тебя там hex строка)
только на значения тебе нужно 30 терабайта на каждый триллион - 32*10^12 и даже в идеальном случае еще 16тб на индекс ключа (чем больше оптимизируешь хранение тем больше операций на чтение и запись каждой)

Недавно была статья на хабре про тесты производительности работы mssql с похожими ключами миллионы записей

Я бы предложил схему с самописным индексом (мне кажется тут колхозить идеальнее всего).
* делишь ключ на 2 части (если бы ключ был не такой равномерный, то нужно было бы брать хеш от него), например по 4 байта
* младшие 4 байта (они наиболее равномерно будут распределены) - это номер блока в общем хранилище (на 1 триллион примерно 9кб, рекомендую. 16кб или 32кб, ssd на таких кластерах идеально работают), с массивом элементов: каждый из которых это вторые 4 байта ключа (старшие байты) + 32 байта искомое значение
для 16кб блока итоговое хранилище будет 70 тб - 2^32*16кб, можно прямо в дисковое устройство писать без файловой системы, по дискам пусть какой-нибудь рейд 0 раскидывает
* последняя запись в 16кб блоке - ссылка на дополнительное хранилище переполнений неравномерного распределения, его можно организовать как хочешь, на отдельном носителе

Итого на каждый запрос ты делаешь ровно одно чтение 16кб блока с диска, в полученном массиве ищешь нужный ключ и получаешь значение (если нет значит переполнения из-за неравномерного заполнения индекса, топать в дополнительное хранилище), кстати можно читать по секторно в процессе поиска, тогда если диск сумеет это оптимизировать будет 2х профит. Запись то точно так же - 1 чтение 16кб и запись 1 сектора диска, дозапись в массив. Кстати, если контролировать порядоковый номер ключевого значения (а что то мне говорит там будет простой перебор всех паролей) то будет последовательная запись блоков на диск, для hdd это идеальная ситуация. Иначе всю оперативную память используешь как самодельный lazy write буфер, при переполнении записываешь его на диск, отсортировав согласно дисковым устройствам и отсортировав порядок номеров секторов (тогда либо понимать как работает рейд либо самому раскидывать по дискам), операционные системы и контроллер диска это умеют но у них кеш маленький.

Такой хеш самый быстрый из всех возможных, так как запилен под задачу, оверхед хранения десяток другой терабайт. Кодить тут минимум, строк сотня другая, и то половина - это код сетевого сервиса, ты ведь захочешь разнести сервис хранения и логику по сети.

Добавь еще один уровень, будет 2 чтения по 8-16кб (когда ты не на 2 части делишь ключевое значение а на 3, первая часть ссылается на список ссылок на вторую часть, которые уже ссылаются на блоки с третьей частью), можно уменьшить этот оверхед но мне кажется скорость в твоей задаче важнее, ведь она упадет в два раза.
Универсальные базы данных делают многоуровневые древовидные индексы (это настраивается) и ради удобства и универсальности ты теряешь в скорости.

Answer 3 · 2022-01-01 22:53:44

Dimonchik @dimonchik2013

non progredi est regredi

Aerospike

Ответ написан более двух лет назад

3 комментария

Answer 4 · 2023-01-02 02:55:51

Так, а что, решения от Яндекса никто не предложил? ClickHouse - это как раз про то, когда данные текут рекой. Но там конечно не key-value.

Answer 5 · 2023-01-02 20:58:01

alfss @alfss

https://career.habr.com/alfss

Предлагаю взглянуть на tarantool
Еще может apache ignite

Ответ написан более двух лет назад

Комментировать

Answer 6 · 2023-01-16 15:57:12

Что пробовали: файловая система (хранение в подпапках вида /a/b/c.../a1.txt, скорость вставки получилась медленная

Тут много времени уходит на создание папок.

Есть такой вариант:

1) Генерируете в памяти по N штук (в завис от размера ram).
dataBundle (словарь/массив/hashSet или т.п.):
   key = pass[0..M] //первые M символов (играем с этим значением)
   value = [[pass, hash], [pass2, hash2], [pass3, hash3]]

2) Скидываем в файл большим массивом (т.е. построчно будет каждый раз открывать)
foreach(var bundle in dataBundle)
{
     // ! не текстовой файл - бинарный
     AppendBytesToFile(d.key, d.value);
    // можем запоминать открытые файлы, чтобы не открывать их потом опять.
}

Результат:

0000.txt
0001.txt
...
asdf.txt:
   asdf0001 hash1
   asdf0002 hash2
   ...
   asdfZZZZ hash

В чем можно хранить около триллиона значений key=>value?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт