Наибольший вклад в теги

MySQL
- 1 ответ
- 0 вопросов
0 Вклад в тег
SQL
- 1 ответ
- 0 вопросов
0 Вклад в тег
NoSQL
- 1 ответ
- 0 вопросов
0 Вклад в тег
Big data
- 1 ответ
- 0 вопросов
0 Вклад в тег

Как следует организовать базу и поиск по 1 000 000 000 000 (триллиону) записей на 100ТБ?

pansa @pansa

Лично меня еще смутили такме моменты:
1) а что это за хэши такие странные - в символах UTF8? Вкурсе, что _1 символ_ в этой кодировке может занять от 1 до 6 байт, что на таком кол-ве записей ведет к огромному разбросу. Если у вас хэш из ASCII, то тогда зачем притянули сюда UTF8?
2) 32-64 символа -- так 32 или 64? На вашем кол-ве это разница +- 50Тб . Это довольно серьезные объемы.
3) Как вы посчитали 100Тб? Вы учли место под индекс?

Идеи по проблеме:
1) тащить сюда реляционку не стоит, ибо...
2) очевидно, что это всё надо запускать не на одной машине, на глаз - минимум 2, не считая бэкапа (он нужен?) либо реплик => шардинг => kv-хранилища подойдут лучше (если мы правильно поняли, что вы хотите)
3) ничего не сказано про кол-во запросов - вставки/чтения. Но я бы подумал над размещением перед этим хранилищем предварительной проверке по фильтру Блума, чтобы лишний раз не стукаться в хранилище. Но это надо знать характер данных и запросов.

Ответ написан более трёх лет назад

4 комментария

Как следует организовать базу и поиск по 1 000 000 000 000 (триллиону) записей на 100ТБ?

Войдите на сайт