В чем польза шардирования БД при наличии индексов?

Question

footballer @footballer

В чем польза шардирования БД при наличии индексов?

Шардирование (горизонтальное партиционирование) — это принцип проектирования базы данных, при котором логически независимые строки таблицы базы данных хранятся раздельно, заранее сгруппированные в секции, которые, в свою очередь, размещаются на разных, физически и логически независимых серверах базы данных

Если у нас таблица в миллионы записей и для поиска в ней конкретных данных конкретного пользователя мы делаем перебор всех данных всех пользователей (если нет индексов), то да - разбиение таблицы и хранение данных для каждого отдельного пользователя на разных серверах имеет смысл. Но если у нас есть индексы по полю-идентификатору пользователя (а индексы в больших таблицах есть всегда), то мы итак не будем перебирать все данные всех пользователей - тогда чем такое раздельное хранение данных на разных серверах для каждого пользователя нам помогает?
Разве что при апдейте\инсерте данных для одного пользователя нам нужно обновить индекс данных только этого пользователя, а не общий индекс для всех (но и тут не очевиден выигрыш - т.к. хоть индекс стал меньше и обновляется быстрее, зато при каждом запросе нам нужно дополнительно разруливать, с какого шарда брать данные для данного юзера).
В общем, в чем конкретно выигрыш от шардирования?

Вопрос задан более трёх лет назад
249 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

5 недель

Далее
Академия Eduson

SQL-разработчик: тариф Базовый

3 месяца

Далее
Stepik

Полный курс по JavaScript - С нуля до результата!

4 недели

Далее

Пригласить эксперта

Ответы на вопрос 5

Комментировать

2 комментария

footballer @footballer Автор вопроса

На прошлой работе как раз были проблемы со скоростью загрузки данных с большой базы и таймауты, при этом были созданы все индексы, поэтому одним из вариантов ускорения загрузки с бд как раз рассматривалось шардирование. Не знаю, в итоге реализовали его или нет, но если даже реализовали, то оно и не должно было ничем помочь?

Написано более трёх лет назад
Vitsliputsli @Vitsliputsli

footballer, смотря какую проблему таким образом решали и как решали. Вероятнее всего таким образом распределяли нагрузку на несколько СУБД, т.к. одна уже не справлялась. Таким образом СУБД разгружается и сможет отвечать быстрее. В таком контексте да, но не в том контексте, что заменяем индексы на шарды и получаем больший выигрыш. Т.е. индексы позволяют СУБД перелопачивать меньше данных по запросу, а шарды позволяют распределить нагрузку на несколько серверов - это совсем разные направления.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

API

+1 ещё

Простой
Точь в точь ли маппятся поля json-сущности на поля в таблицах базы данных?
- 1 подписчик
- 05 июл.
- 237 просмотров
2

ответа
Проектирование баз данных

Простой
Правильно ли построена ER диаграмма?
- 1 подписчик
- 11 мая
- 267 просмотров
1

ответ
Информационная безопасность

+2 ещё

Простой
Данная схема реализации базы данных подходит под рамки 152-ФЗ?
- 1 подписчик
- 17 апр.
- 562 просмотра
2

ответа
PostgreSQL

+1 ещё

Простой
Проектирование БД: чем сейчас люди пользуются?
- 1 подписчик
- 09 апр.
- 484 просмотра
4

ответа
Проектирование баз данных

Простой
Как лучше сделать базу данных?
- 1 подписчик
- 07 мар.
- 334 просмотра
5

ответов
Проектирование баз данных

Средний
Как спроектировать dwh звезда?
- 1 подписчик
- 05 мар.
- 74 просмотра
1

ответ
Проектирование баз данных

Средний
Выбор между SQL и NoSQL документооринтированной базой данных?
- 2 подписчика
- 01 мар.
- 1005 просмотров
2

ответа
Проектирование баз данных

Простой
Как лучше обновлять счётчик записей?
- 1 подписчик
- 27 февр.
- 147 просмотров
4

ответа
Проектирование баз данных

Простой
Как организовать таблицу для хранения ответов теста?
- 2 подписчика
- 21 февр.
- 298 просмотров
2

ответа
Проектирование баз данных

Простой
Как хранить данные о недвижимости?
- 1 подписчик
- 17 февр.
- 196 просмотров
1

ответ
Показать ещё Загружается…

IT-архитектор

АВ Софт • Москва

от 300 000 ₽

Маркетинговый аналитик

МТС Web Services • Грозный

от 60 000 ₽

Senior DWH Analyst

Анвио Парк

от 200 000 до 300 000 ₽

Answer 1 · 2020-09-08 14:27:03

Пока у вас всего лишь миллионы записей - то вам ни шардирование ни даже партицирование не нужно.

В общем, в чем конкретно выигрыш от шардирования?

Масштабирование операций записи когда более производительные диски и уже не поставить.

Answer 2 · 2020-09-08 14:09:38

индексы работают локально, Шардирование - глобально. Пока у вас один маленький сервер то вам Шардирование не поможет, а когда у вас кластер то очень даже

Answer 3 · 2020-09-08 14:30:49

В общем, в чем конкретно выигрыш от шардирования?

Шардирование не предназначено для ускорения доступа к данным, поэтому нет смысла сравнивать с индексами, во всяком случае не в таком контексте как вы описали. Шаридирование - это вариант горизонтального масштабирования. Когда вы не сможете больше увеличивать мощность одного сервера СУБД под возросшие потребности, то придется задуматься о нескольких серверах СУБД, т.е. о горизонтальном масштабировании, а шардирование один из его вариантов.

Answer 4 · 2020-09-08 14:32:55

Допустим у вас диск в 100 гигабайт

Данные пользователя 1 мегабайт

Итого 102400 пользователя. Куда будем девать остальных?

Answer 5 · 2020-09-11 14:44:13

к выше сказанному можно добавить, что шардирование уместно использовать, когда вы данные пользователей из России должны хранить в России, а данные пользователей ЕС в ЕС, например. Кроме того, шардирование может быть полезно в плане общей "устойчивости" системы - отвалился шард - большая часть пользователей остаётся доступной.
Т.е. шардирование - это больше не про скорость доступа к данным, а про управление ими.

В чем польза шардирования БД при наличии индексов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт