Какую key-value БД использовать с данными в 10 млрд строк записей?

Question

gamoyo5524 @gamoyo5524

Базы данных

Какую key-value БД использовать с данными в 10 млрд строк записей?

Какую "key-value" БД использовать для хранения 10 или более млрд строк данных?

Критерии:
- довольно быстрый импорт
- быстрый поиск/получение значения по ключу
- возможность одному значению задавать 5 ключей и более (некоторые ключи могут совпадать)

Как выглядят мои данные:
key_1 = 5 символов | key_1 = 6 символов | key_3 = 7 символов и более = значению в 120 символов (какие символы используются: 0-9 A-Z a-z)

Что я использовал раньше:
Раньше нужно было использовать один ключ/значение и данных было в районе ~ 800 млн записей и я использовал Redis (512 RAM) без снапшотов, в случае падения я заново нагружал, довольно таки быстрым импортом.

С чем я столкнулся в MySQL:
На данный момент данные построчно записанны в .txt которые я переконвертировал в .sql и попробовал использовать MySQL, для теста решил загрузить 200 млн строк, для всех столбцов использовал тип VARCHAR задав каждом столбцу нужную мне длину, импорт прозошел очень быстро, по поиск/получение занимал до 2 минут и я погуглив понял что нужно добавить на ключи индексацию, сделав это - поиск занимал до миллисекунды. НО с какими проблемами я столкнулся дальше: если создать пустую структуру и задать столбцам сразу индекс быстрый импорт превращается в очень медленный, будто скорость -x100, и я подумал без индексов загрузить сразу 5 млрд записей а дальше задать индексы но не тут та было спустя ~ 6 часов обработки ошибка "ERROR 1034 (HY000): Index for table 'TABLE_NAME' is corrupt; try to repair it"

Вопрос задан более двух лет назад
1616 просмотров

8 комментариев

Подписаться 9 Простой 8 комментариев

Anonymous @Nikita1244

PostgreSQL если хотите SQL, он в некоторых нюансах лучше, чем MongoDB. Но если нужна простота и быстрота - MongoDB.
Redis по моему плохая БД для 10 млрд записей. Она вроде хранит все в драгоценной ОЗУ для быстроты поиска. Но минус - нужен много-много оперативки. Если я неправильно сказал, поправьте, пожалуйста.

Написано более двух лет назад
Anonymous @Nikita1244

https://habr.com/ru/post/348220/
Вот, можно почитать этот пост. Полезный довольно.

Написано более двух лет назад
d'Ivan @2ord

Никита Савченко,

Вот, можно почитать этот пост. Полезный довольно

MySQL не справился от слова вообще. MongoDB справился без особых проблем.
С чем не справилась? Непонятно. С чем другая таки справилась? В каком сценарии?

Написано более двух лет назад
d'Ivan @2ord

~ 6 часов обработки ошибка "ERROR 1034 (HY000): Index for table 'TABLE_NAME' is corrupt; try to repair it"
А характеристики железа какие, включая накопители? Какая файловая система и размер блока?

Написано более двух лет назад
mayton2019 @mayton2019

Никита Савченко,

Но если нужна простота и быстрота - MongoDB.

ммм... нет. Монго здесь скорее всего не подходит.

Написано более двух лет назад
d'Ivan @2ord

Автор, покажи схему таблицы, используемую для теста:
SHOW CREATE TABLE table_name;

Написано более двух лет назад
Даша Циклаури @dasha_programmist

mayton2019, а вкратце "почему?" пожалуйста

Написано более двух лет назад
mayton2019 @mayton2019

Даша Циклаури, монго предполагает документы. И schema-less тип значения. Это означает что у нас нет строгой спецификации и мы можем на ходу добавлять другие поля. Но мы за это расплачиваемся дополнительным местом. Binary-JSON тоже имеет теговую разметку внутри и если сравнивать с классической БД то Mongo имеет обычно больше накладных расходов в расчете на 1 data-row. Тоесть монго база с 10 млрд документов создаст вам бОльшие проблемы в поддержке чем MySQL.

Написано более двух лет назад

Пригласить эксперта

Ответы на вопрос 4

41 комментарий

Anonymous @Nikita1244

MySQL который указан в тегах - нормально справляется с этой задачей.

Да, он может хранить 10 млрд записей. Но он медленный.

4) Непонятно зачем здесь указан Redis. Его задача не хранить 10 млрд а хранить только горячие
ключи по котороым идет очень частый доступ.

Верно. Эта БД хранится в ОЗУ для того чтобы быстро искать с помощью нее. Для большой БД это невыгодно. 10 млрд записей сожрут много ОЗУ.

Написано более двух лет назад
Сергей Горностаев @sergey-gornostaev

Никита Савченко,

Эта БД хранится в ОЗУ для того чтобы быстро искать с помощью нее. Для большой БД это невыгодно. 10 млрд записей сожрут много ОЗУ.

Можно взять какой-нибудь грид или что-нибудь с шардингом.

Написано более двух лет назад
mayton2019 @mayton2019

Я-бы начал торги с подсчета исходных данных. Сколько их не в ключах а в гигабайтах? Исходя из этого можно дальше прикидывать что это. Сервер или грид из серверов. Все архитектуры хорошие и годные.

Написано более двух лет назад
Anonymous @Nikita1244

GNUBack, так это давно доказанный факт. MySQL медленный, но его производительность значительно улучшили в последние годы, всё же.

Написано более двух лет назад
mayton2019 @mayton2019

Никита Савченко, MySQL - это некий лейбл под которым работают различные engines. И чисто для прояснения
ситуации я-бы спросил об условиях бенчмарка.

Написано более двух лет назад
mayton2019 @mayton2019

Никита Савченко,

Для большой БД это невыгодно. 10 млрд записей сожрут много ОЗУ.

Отвечая на вопрос я обычно привлекаю базовую арифметику. Если ключом является например
телефон (тех-средство) и значением например статус (активен-неактивен) - то мы можем
примерно прикинуть сколько нам надо памяти в сыром виде. И от этого дальше рассуждать.
Накинуть коэффициентик для накладных хеш-таблицы.

Но я подожду пока автор ответит на вопрос об общем объеме датасета.

Написано более двух лет назад
Anonymous @Nikita1244

GNUBack,так сами почитайте Гугл. Это правда.

Написано более двух лет назад
ThunderCat @ThunderCat

Никита Савченко,
Да, он может хранить 10 млрд записей. Но он медленный.
Во первых - скорость мускуля сильно зависит от... всего. От железа, от настроек, от используемого движка, от метода хранения таблиц и еще много от чего на самом деле.

Во вторых, заявление "он медленный" можно привести только в связке с условием "относительно db_name", в другом случае это пуканье в лужу. Даже если рассматривать сравнение мускуль-редис, при прочих равных (например инмемори таблицы мускуля), алгоритмы поиска будут +- одинаковые, и результаты будут весьма близки. Другой вопрос что при сопоставимых скоростях мускуль выигрывает по стоимости операции, так как не сожрет всю память, а будет искать на весьма дешевом диске.

Если есть охулиард денег и нужен максимум перформанс - редис подойдет.
Если есть конечный бюджет и скорость нужна конкретная (не более N мс запрос), а не максимальная - тюнить мускуль выглядит более здравой идеей.

Написано более двух лет назад
Дмитрий @iMedved2009

Никита Савченко, в гугле можно найти и доказательства что земля плоская. Но вот плоской она от этого не становится. Ваше заявление из той же оперы

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, спасибо за Ваш ответ, я обновил свой вопрос, постарался описать всю проблему!

Написано более двух лет назад
mayton2019 @mayton2019
- возможность одному значению задавать 5 ключей и более (некоторые ключи могут совпадать)

1) Непонятно что может совпадать. Всмысле работает как compressed index Oracle?

CREATE INDEX t1_idx ON t1(key1, key1,key3) COMPRESS 5;

Если ключи key1 будут повторяться в серии строк то oracle не будет выделять под них дополнительное место. Это имелось в виду?

2) Непонятно почему их стало 3. Ведь сначала речь шла о 5 ключах.

3)

На данный момент данные построчно записанны в .txt которые я переконвертировал в .sql

Не надо конвертить в SQL. Лучше конвертить в CSV. У всех dbms есть коробочные средства загрузки
comma-separated и работает быстрее потому что нет лишней фазы синтаксической SQL трансляции.

4)

если создать пустую структуру и задать столбцам сразу индекс быстрый импорт превращается в очень медленный, будто скорость -x100, и я подумал без индексов загрузить сразу 5 млрд записей а дальше задать индексы но не тут та было спустя ~ 6 часов обработки ошибка "ERROR 1034 (HY000): Index for table 'TABLE_NAME' is corrupt; try to repair it"

Раз уж ты начал мучать MySQL то его надо домучать до конца. Значит стратегия должна быть такая.
Создается пустая таблица без индексов и констренйтов. В нее загружается все. Потом индекс включается
через create index...

Как разогнать? Надо понять степень параллелизма дисковой системы. Если у тебя таблица стоит на RAID 10 к примеру то можно создать семейство таблиц с одинаковой шапкой

table1
table2

И грузить скриптами паралелльно. Но надо внимательно мониторить. Если скорость загрузки стала хуже
- то вернуться обратно к однопоточной процедуре загрузки.

При параллелизме не надо их соединять. Пускай система так и работает. А роутинг запросов
ты будешь адресовать к нужной таблице по хешу.

Тоесть если hash(key1,key2,key3) == 0 по модулю 2 то пишешь в первую таблицу.
Если равен 1 по модулю два - то во вторую.

По такому-же принципу режешь CSV данные на два стрима. На прикладом уровне понятное дело.
Как ты это сделаешь (на Python или на Bash или на Ruby) я не знаю. Я здесь как мудрый филин
говорю ежам что надо вырастить колючки.

Тобишь я предполагаю что ты - разработчик системы и знаешь что такое хеширование в прикладном
коде и хеширование в MySQL. Но это - серебрянная пуля которая всегда помогала разогнать
медленные системы.

Этот-же принцип кстати работает и в DynamoDb, CosmosDb и прочее. Данные хешируются и потом
пишутся в хеш-блоки хранилища. Именно так Майкрософт и Амазон достигают гарантированной
пропускной способности. Сколько заплатил - столько и юнитов параллелизма получит. У них
даже термин свой был. Типа provisioned чего-то там...
Написано более двух лет назад
mayton2019 @mayton2019

Да. По поводу этой ошибки.

ERROR 1034 (HY000): Index for table 'TABLE_NAME' is corrupt; try to repair it

Я к сожалению не знаю что это. Но думаю что в форуме сидят другие MySQL-щики
которые уже с этим сталкивались. Как вариант - ты превысил лимиты на что-то.
И возможно надо резко поменять конфигурацию. Engine поменять например.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, с Вами можно как-то связаться ?

Написано более двух лет назад
mayton2019 @mayton2019

gamoyo5524, ну вот я тут. Вот и связывайся. У меня нет секретов от хабра.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, я хотел бы предложить вознаграждение за помощь)

Написано более двух лет назад
mayton2019 @mayton2019

gamoyo5524, не интересует. Я здесь просто время провожу. Заработок и так есть.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, Непонятно что может совпадать. Всмысле работает как compressed index Oracle?

Имеется ввиду что индексы не могут быть уникальными:

| key_1(5) | key_2(6) | key_3(7) | key_4(8) | key_5(9) | value(120)
1 | AbCde | AbCde1 | AbCde1B | AbCde1B2 | AbCde1B2a | asdsdsadasdasd...
2 | AbCde | AbCde4 | AbCde4h | AbCde4hG | AbCde4hGm | d21d4ff34ff34f...

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, и если пустая структура импорт довольно быстрый, проблема лишь в том что если я задаю индекс для столбца, в моем случае я использовал ALTER TABLE `TABLE_NAME` ADD INDEX(`COLUMN_NAME`); прошло кучу времени и вылетела ошибка и учитывая как она плохо описана я не могу нагуглить что произошло не так

Написано более двух лет назад
mayton2019 @mayton2019

Посмотри как тут делают https://dev.mysql.com/doc/refman/8.0/en/create-tab...

и попробуй повторить эксперимент для MyISAM, InnoDB

create table(....) ENGINE=MyISAM;

create table(....) ENGINE=InnoDB;

потом построй индекс для 2 вариантов.

10 лярдов грузить не надо. Загрузи только минималку где воспроизводится дефект.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, если я пересоздам таблицу - мне придется снова загружать 6 млрд записей, а это часов 10 если не более

Написано более двух лет назад
mayton2019 @mayton2019

gamoyo5524, ты можешь сделать extract ddl для той таблицы которая уже создана? Надо глянуть какой ты уже использовал engine.

Тогда тебе надо не 2 эксперимента делать а только один. И можешь не убивать а создать таблицу номер два.
Пускай будут две. Тебе ж не жалко места?

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, место не жалко если оно влезло бы :D
А там осталось гигов 100 места свободного, а это занимает 1.2 TB

Написано более двух лет назад
mayton2019 @mayton2019

gamoyo5524, ну я не знаю. Сбегай в магазин купи еще 4 Терабайник.
Ты же owner этой задачи. Хозйственные вопросы тоже на тебе.
Почисть что-нибудь. Убей что-нибудь.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, в данный момент времени выдали этот сраный сервер и ничего поделать не могу, а таску нужно решить)

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, сейчас используется ENGINE=InnoDB

Написано более двух лет назад
mayton2019 @mayton2019

У тебя поле value сильно толстое. Загрузи без него. Для теста индекса этого будет достаточно а места меньше надо будет.

Написано более двух лет назад
mayton2019 @mayton2019

сейчас используется ENGINE=InnoDB

Отлично. Вот тестируй myisam.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, еще вопрос, со стока XAMPP MYSQL нужно как-то настраивать ? Мб проблема в этом

Написано более двух лет назад
mayton2019 @mayton2019

Не ко мне вопрос. Я не знаю что такое XAMPP.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, еще вопрос, нужно ли давать какой-то первичный ключ автоинкремент какой-то ?

Написано более двух лет назад
mayton2019 @mayton2019

gamoyo5524, это к тебе вопрос. Ты должен знать свои данные со стороны бизнеса. Если 5 ключей в совокупности уникальны - то никаких авто-инкрементов не нужно.

Если они не уникальны - тогда key-value схема здесь вообще не подходит.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, я ведь это написал "Имеется ввиду что индексы не могут быть уникальными" и мало того еще привел пример данных

Написано более двух лет назад
mayton2019 @mayton2019
В этом примере у тебя все в порядке.

| key_1(5) | key_2(6) | key_3(7) | key_4(8) | key_5(9) | value(120) 1 | AbCde | AbCde1 | AbCde1B | AbCde1B2 | AbCde1B2a | asdsdsadasdasd... 2 | AbCde | AbCde4 | AbCde4h | AbCde4hG | AbCde4hGm | d21d4ff34ff34f...

Композитный индекс будет уникален поскольку key2, key3, key 4... создают достаточно
уникальности для этого.

Возможно ты - новичек в базах данных и тебя смущает терминология.
Написано более двух лет назад
mayton2019 @mayton2019

Я понял в чем у нас основное непонимание. Ты не описал типичные запросы.
Тюнинг БД а 99% состоит из нескольких важных для бизнеса запросов которые должны
работать очень быстро. На остальные - наплевать.

Вот если ты будешь искать по 5 ключам - то мой кейс работает.
Если ты захочешь искать по 4 и 5 ключу то мой композитный индекс уже не годится
и нужно придумывать что-то другое.

Когда ты создаешь таблицу и указываешь 5 полей как primary key - то движок MySQL
автоматом создает unique композитный индекс по этим 5 полям и добавляет констрейнт ПК.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, да, вот только сейчас понял что многим не ясна нужная мне логика.
Постараюсь обьяснить простыми словами: во первых мне нужен поиск по 1 из ключей (а не сразу по 5 ключам), абсолютно все ключи не могут быть уникальными, и мне все равно какое value придет! Главное чтобы совпали ключи которые я буду искать.
То есть я могу запросить "SELECT * FROM `TABLE_NAME` WHERE `key_1` = AbCde", или "SELECT * FROM `TABLE_NAME` WHERE `key_2` = AbCde1" и так далее.

Написано более двух лет назад
mayton2019 @mayton2019
Я понял. Возможно причина падения индекса в том что он не выдерживает низкой кардинальности столбца.
Посчитай кардинальность каждой колонки.

select count(*) from (select distinct(key_1) from table1); select count(*) from (select distinct(key_2) from table1); ..

До того как строить индекс.

Если значения будут порядка 10% от всего объема строк - то тогда индекс вообще строить не надо.
Он будет не эффективен.
Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, вообще части ключей это определенные обрезки от value, я сначала планировал просто regex делать по value, это был мой первый опыт в работе с бд и с regex даже с 5 млн строк поиск был ужасно долгий, после я вычитал про hashmap и использовал его, на данный момент ключи часто могут совпадать и это уже все усложняет. Учитывая что в каждом ключе может быть a-zA-Z0-9 это для первого ключа: 62^5 = 916 132 832 вариантов то есть для первого ключа данные с 10 млрд будут очень совпадать, для второго 62^6 = 56 800 235 584 уже история по лучше но рассчитать дубли тут уже анриал)
Вот я задумываюсь может дабы не нагружать все в одну таблицу разделить таблицы по первому символу ключа, например создать таблицы a-z и 0-9 и уже так рассортировывать, если это конечно упростит процесс)

Написано более двух лет назад
mayton2019 @mayton2019

gamoyo5524, моя интуиция подсказывает мне что ты велосипедишь страшный велосипед.
Вот эти вот обрезки ключей и прочее.

И на самом деле тебе ( может быть ) нужен text-search по value. И это совсем другая задача.

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

В моем случае я могу обойтись одним value, просто то что я тестировал поиск по 10 млрд строк это было ужасно долго и мне не подходило, по этому когда нашел hashmap строю логику дальше по нему, если есть варианты искать в строке очень быстро я бы почитал мануал по этому поводу, но даже не знаю как загуглить

Написано более двух лет назад
gamoyo5524 @gamoyo5524 Автор вопроса

mayton2019, есть какие-то идеи? А то я погуглив text-search по value ничего не нашел.

Написано более двух лет назад
mayton2019 @mayton2019

Text search работает не везде. Не все dbms его поддерживают.
Text search требует понятие документа. И понятие разделения документа на токены.
Поиск работает по токенам.

Я если честно говоря уже устал от твоей задачи. И главная причина в том что ты изначально
не озвучил проблему. А озвучил уже свои велосипеды и изобретения. От чего
я и участники qna запутались и стали предлагать тебе совсем уже левые решения.

Поэтому давай поставим этот вопрос на закрытие. Ты хорошенько подумай. И создай
новый вопрос где ты выдашь главную постановку а не свои придумки.

Потому что решать проблему XY никто не хочет. Это всех демотивирует.

Написано более двух лет назад

2 комментария

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 79 просмотров
1

ответ
Node.js

+2 ещё

Простой
Как сделать регистрацию без слета через fs?
- 1 подписчик
- 03 июн.
- 162 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Какую базу данных нужно использовать для телеграмм бота?
- 1 подписчик
- 10 мая
- 4810 просмотров
9

ответов
IT-образование

+1 ещё

Простой
С чего начать изучение инженерной части БД?
- 2 подписчика
- 23 апр.
- 377 просмотров
3

ответа
Python

+2 ещё

Простой
Корректно ли в данном случае отправляется запрос в базу данных?
- 1 подписчик
- 23 апр.
- 207 просмотров
2

ответа
Базы данных

Простой
БД для дискорд-бота?
- 1 подписчик
- 17 апр.
- 142 просмотра
1

ответ
Android

+4 ещё

Простой
Какие ресурсы нужны для разработки AR приложения на Unity для «оживления» фото в школьном альбоме?
- 1 подписчик
- 17 апр.
- 221 просмотр
1

ответ
Базы данных

Простой
Какие есть утилиты для автоматизированного проектирования БД?
- 3 подписчика
- 02 апр.
- 2761 просмотр
5

ответов
Базы данных

Простой
RBAC: когда создавать нового пользователя в ДБ?
- 2 подписчика
- 26 февр.
- 202 просмотра
1

ответ
Базы данных

+1 ещё

Простой
Какую скачать СУБД для БД SQlite?
- 1 подписчик
- 15 янв.
- 526 просмотров
5

ответов
Показать ещё Загружается…

Системный аналитик

Synapse AI • Москва

от 130 000 ₽

Golang Developer

ITK academy • Казань

от 75 000 до 120 000 ₽

Программист 1С

Первый мясокомбинат • Нижний Новгород

от 100 000 ₽

PostgreSQL если хотите SQL, он в некоторых нюансах лучше, чем MongoDB. Но если нужна простота и быстрота - MongoDB.
Redis по моему плохая БД для 10 млрд записей. Она вроде хранит все в драгоценной ОЗУ для быстроты поиска. Но минус - нужен много-много оперативки. Если я неправильно сказал, поправьте, пожалуйста.
https://habr.com/ru/post/348220/
Вот, можно почитать этот пост. Полезный довольно.
Никита Савченко,

Вот, можно почитать этот пост. Полезный довольно

MySQL не справился от слова вообще. MongoDB справился без особых проблем.
С чем не справилась? Непонятно. С чем другая таки справилась? В каком сценарии?
~ 6 часов обработки ошибка "ERROR 1034 (HY000): Index for table 'TABLE_NAME' is corrupt; try to repair it"
А характеристики железа какие, включая накопители? Какая файловая система и размер блока?
Никита Савченко,

Но если нужна простота и быстрота - MongoDB.

ммм... нет. Монго здесь скорее всего не подходит.
Автор, покажи схему таблицы, используемую для теста:
SHOW CREATE TABLE table_name;
mayton2019, а вкратце "почему?" пожалуйста
Даша Циклаури, монго предполагает документы. И schema-less тип значения. Это означает что у нас нет строгой спецификации и мы можем на ходу добавлять другие поля. Но мы за это расплачиваемся дополнительным местом. Binary-JSON тоже имеет теговую разметку внутри и если сравнивать с классической БД то Mongo имеет обычно больше накладных расходов в расчете на 1 data-row. Тоесть монго база с 10 млрд документов создаст вам бОльшие проблемы в поддержке чем MySQL.

Answer 1 · 2023-03-19 17:01:46

Несколько мыслей.

1) У меня устойчивое дежа-вю. Периодически в топик заходят люди с именно этим вопросом. Разница только в количестве. Кому 1 млрд. Кому 10. Можно также поискать и слинковать эти вопросы в один большой вопрос.

2) MySQL который указан в тегах - нормально справляется с этой задачей. Он и не такое число строк
умеет хранить. И если взять MariaDb - там есть куча новых engines которые можно крутить для тюнинга
именно скорости чтения. Разумеется жертвуя чем-то другим. Транзакциями и записью например.

3) Непонятно что такое минимальное время? Если использовать дисковую БД типа MySQL то деградация времени
поиска будет примерно зависеть от логарифма количества строк. Тоесть деградация будет но очень медленно.
Для 10 млрд индекс по key будет содержать порядка 4-5 уровней BTree дерева. Тоесть дисковой системе
нужно будет сделать до 5 или до 6 рандомных чтений (если нужные данные лежат в таблице). Это достаточно
быстро для того чтобы моргнуть глазом за это время. Рандомное чтение любого блока из магнитного диска
класса SATA-3 занимает порядка 20 милисекунд. Тоесть для 5 уровней - это 100 милисекунд. Для дисков
класса SSD и это время можно уже считать меньше милисекунды. Точно я не знаю надо мерять.

Испортить это время может сетевой лаг который в данной задаче мы просто не учитываем. Считаем что сеть идеальна.

4) Непонятно зачем здесь указан Redis. Его задача не хранить 10 млрд а хранить только горячие
ключи по котороым идет очень частый доступ. Если автор хочет In-memory хранение - то время можно
еще сильнее улучшить. Его можно свести практически до нуля (я вангую несколько микро-секунд)
но придется прикупить планок памяти побольше и посчитать сколько памяти
надо для 10 млрд key/values неизвестной длины. Вообще крутить регулятор в направлении
микро-секунд нет особого смысла т.к. другие звенья вашего стека (приложение и сеть) могут
быть на порядки медленнее а это вообще нивелирует всю пользу от такой оптимизации.

Answer 2 · 2023-03-19 20:09:44

Ответ зависит от требований к данным и особенностей записи, многопользовательская или нет (транзакции на запись - сильно выставляет требования к ресурсам), есть ли модификация данных (очень важный момент роняющий производительность в зависимости, правда если данные фиксированного размера то возможно не сильно), виды запросов на поиск и аналитику, (кому то нужны поиск по значению, а кому то сравнения больше/меньше, поиск min/max и сортировки, кому то нужны группировки по значению в индексе и многое другое), наличие упорядоченных данных (когда данные записываются последовательно и в запросах часто фигурирует выгрузка данных на интервале).

Отличный пример - числовое ключевое поле с монотонным ростом без пропусков позволяет использовать самый простой индексный файл где значение ключевого поля это смещение слова (например 4 байта) в индексном файле, а эти слова - это смещение в файле данных (например номер кластера фс, данные выровнены по нему). Файл данных это тупая последовательность размер+данные без разделителя.

Достоинства - максимальная из возможных производительность (файл данных и индексный файл могут храниться без файловой системы прямо в блочных устройствах), буквально 2 запроса на запись/поиск (при использовании файловых систем операций будет в несколько раз больше), ни одна универсальная база данных не даст такой. Кода - строк 20-30 на любом языке программирования, красиво можно пользоваться memory mapped files (они дают самую быструю работу с файлами и удобную под задачу). Данные пишутся линейно на диск (оптимально для hdd, само собой если не одновременно с чтением), большинство файловых и операционных систем поддерживают sparce файлы (будут накладные расходы, но константа), это значит можно с некоторыми оговорками пользоваться большими пропусками в порядке индексов (дырка в файле вернет нули, на диске храниться не будет).

Недостатки/особенности - требуется некий роутер, для управления несколькими файлами, если размер данных может выходить за пределы имеющихся устройств (в реляционных базах данных для этого есть прозрачный механизм tablespace), но на практике красивых монотонных индексов не существует и приходится выкручиваться, например группировать данные

Пример - временной ряд, в секунду происходят тысячи событий, хранить группами по секунде, т.е. ключевое поле для индекса - это timestamp-стартовое время файла, при среднем размере информации о событии в 100байт и 4 тысячи событий в секунду, на 3терабайтовый диск hdd индексы будут порядка 30 мегабайт, что прекрасно влезает в оперативную память. У меня самый дешевый toshiba3тб выдавал 60 req/sec случайных запросов (как в синтетических бенчмарках), при этом запрашивать можно было сразу большими интервалами, что роняло скорость максимум в 2-3 раза, пока данные влезали на дорожку (в зависимости от расположения там по разному). Последовательное чтение данных само собой работало на максимуме скорости диска в 150-200мб/с.
p.s. от такой модели отказался за ненадобностью, данные хорошо упаковывались большими блоками (в 10 раз), храню теперь просто в архивах большими блоками по несколько часов, на время работы нужные данные переливаются во временные файлы.

Помню тут на хабре была статья где человек залил в mssql миллионы записей, и радовался секундам на запрос (правда там хеши но это не так важно, для них тоже есть решения)

Answer 3 · 2023-03-20 00:43:35

uvelichitel @uvelichitel

habrahabr.ru/users/uvelichitel

bitcoin blockchain клиенты, (классический на С и популярный на Go) употребляют lmdb www.lmdb.tech/doc

Ответ написан более двух лет назад

Комментировать

Answer 4 · 2023-03-20 11:11:14

Я бы посмотрел в сторону кликхауса для таких данных, если можете обеспечить вставку пачками, вставка не частая и чтение не идёт по одной записи https://clickhouse.com/docs/ru

Какую key-value БД использовать с данными в 10 млрд строк записей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт