Архитектура кластера баз данных для географически распределенного проекта?

Question

wvi3uecbwe @wvi3uecbwe

Базы данных

Архитектура кластера баз данных для географически распределенного проекта?

Всем привет! у каждого джуна происходит переломный момент, когда наспех собранной мускул таблички перестаёт хватать, латенси падает, все рушится, и следующий проект нужно собирать уже максимально грамотно.

Допустим, мы разрабатываем клиент-серверное приложение, в котором все клиенты много пишут данных, но читают и вовсе в несколько раз больше. Чат/мессенджер/что-то подобное.
Я задался вопросом верной архитектуры бекенда для подобной задачи с точки зрения хранения данных, и накидал грубую схемку:

Я приблизительно понял, как распределить нагрузку по чтению, плюс не обязательно делать это именно по регионам, это я так, для примера их привел. Но, грубо говоря, балансировщик нагрузки должен отправлять клиента на ноду, близкую к нему, например, где он с меньшей задержкой получит свои сообщения.
Допустим, так же - с записью, только чтоб не происходило проблем с одновременной записью с разных источников - сделал очередь сообщений. т.е. сбор потоков сообщений в одну кучу, а далее в "однопоточном" режиме запись в master базу. Хреново как-то получается, нет? Выходит, точка отказа - мастер бд + сервис очередей, и общая пропускная способность и скорость всего и вся зависит от этих двух частей. В чем я не прав и как сделать лучше?
по хорошему, надо и писать сначала в slave чтоб не было так что юзер отправил сообщение, но увидел его же только через, условно, 20 минут, когда оно пройдет весь путь от записывателя до считывателя в том же регионе. НО как в таком случае тогда это должно все выглядеть - вообще не представляю.

Вопрос задан более года назад
2430 просмотров

6 комментариев

Подписаться 7 Средний 6 комментариев

mayton2019 @mayton2019

Ты собрался построить идеальную систему в которой 8 миллиардов пользователей планеты Земля
мгновенно увидят сообщение отправленное тобой? :)

Написано более года назад
wvi3uecbwe @wvi3uecbwe Автор вопроса

mayton2019, не вижу повода к этому хотя бы не стремиться) да и мне всегда казалось, что это рядовые вопросы для проектов хоть сколько нибудь серьезных, нет?

было бы лучше, будь мастерами - регионы, а слейвом одно некое хранилище?
в таком случае мою проблему решил бы такой механизм, который был бы иерархически между репликацией и шардированием, назовём его "селективное кеширование", которое могло бы по ключу (допустим, id диалога) подтягивать со слейв-базы диалоги по их айди, и удалять если долго не было обращений, и регионально показывало бы моментально отправленные в этом же регионе сообщения, но каким образом должна работать запись в слейв с нескольких источников - я не понимаю. Это же узкое место, там auto-increment айдишники. Допустим, мой вопрос можно свести именно к работе бд с точки зрения репликации по вопросу записи из разных источников. неужели можно это делать как то без сервиса очередей?

Написано более года назад
mayton2019 @mayton2019

wvi3uecbwe, у тебя уже есть готовый environment где это все можно тестировать?

Написано более года назад
wvi3uecbwe @wvi3uecbwe Автор вопроса

mayton2019, что именно ты подразумеваешь под environment? работающее с монолитным бэком приложение и пользователи есть. жалобы по скорости и по разным проблемам есть. я могу хоть железо в разных цодах взять, это не беда. и нагрузочное тестирование синтетическое никто не отменял.

Написано более года назад
mayton2019 @mayton2019

Поскольку пятница. Я сразу скажу что диаграмма твоя вполне себе рабочая. Мне нравится.

По всем остальным твоим сомнениям. Очень сумбурно.
Надо подумать. Запуск твоей master БД в режиме primary-standby - имеет коробочное решение.
Он технически решен например для Oracle/MS-SQL. Я не знаю что здесь еще добавить.
Запускай две БД и настраивай аварийное переключение.

По поводу сбоя самого балансера. Я не специалист в сетях и я тут не знаю что придумать. А как разработчик
я-бы предложил забить в клиентов 2 имени типа application1.com, application2.com и пускай они
ходят туда где доступно. Такая технология используется в умных драйверах Apache Cassandra.

Написано более года назад
wvi3uecbwe @wvi3uecbwe Автор вопроса

mayton2019, спасибо!!!

Написано более года назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер по тестированию

5 месяцев

Далее
Thinknetica

Профессиональная разработка на Ruby on Rails

9 месяцев

Далее
Специалист.ру

Основы программирования и баз данных

1 месяц

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 68 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 230 просмотров
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 178 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 188 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 234 просмотра
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 323 просмотра
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 445 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 216 просмотров
1

ответ
Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 93 просмотра
1

ответ
Node.js

+2 ещё

Простой
Как сделать регистрацию без слета через fs?
- 1 подписчик
- 03 июн.
- 168 просмотров
2

ответа
Показать ещё Загружается…

Big Data / ETL Engineer

Oracul Analytics

от 300 000 до 450 000 ₽

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Ты собрался построить идеальную систему в которой 8 миллиардов пользователей планеты Земля
мгновенно увидят сообщение отправленное тобой? :)
mayton2019, не вижу повода к этому хотя бы не стремиться) да и мне всегда казалось, что это рядовые вопросы для проектов хоть сколько нибудь серьезных, нет?

было бы лучше, будь мастерами - регионы, а слейвом одно некое хранилище?
в таком случае мою проблему решил бы такой механизм, который был бы иерархически между репликацией и шардированием, назовём его "селективное кеширование", которое могло бы по ключу (допустим, id диалога) подтягивать со слейв-базы диалоги по их айди, и удалять если долго не было обращений, и регионально показывало бы моментально отправленные в этом же регионе сообщения, но каким образом должна работать запись в слейв с нескольких источников - я не понимаю. Это же узкое место, там auto-increment айдишники. Допустим, мой вопрос можно свести именно к работе бд с точки зрения репликации по вопросу записи из разных источников. неужели можно это делать как то без сервиса очередей?
wvi3uecbwe, у тебя уже есть готовый environment где это все можно тестировать?
mayton2019, что именно ты подразумеваешь под environment? работающее с монолитным бэком приложение и пользователи есть. жалобы по скорости и по разным проблемам есть. я могу хоть железо в разных цодах взять, это не беда. и нагрузочное тестирование синтетическое никто не отменял.
Поскольку пятница. Я сразу скажу что диаграмма твоя вполне себе рабочая. Мне нравится.

По всем остальным твоим сомнениям. Очень сумбурно.
Надо подумать. Запуск твоей master БД в режиме primary-standby - имеет коробочное решение.
Он технически решен например для Oracle/MS-SQL. Я не знаю что здесь еще добавить.
Запускай две БД и настраивай аварийное переключение.

По поводу сбоя самого балансера. Я не специалист в сетях и я тут не знаю что придумать. А как разработчик
я-бы предложил забить в клиентов 2 имени типа application1.com, application2.com и пускай они
ходят туда где доступно. Такая технология используется в умных драйверах Apache Cassandra.

Answer 1 · 2024-09-13 22:52:06

Если "чат/мессенджер/что-то подобное", будет лежать очень много данных. То есть профили можно сохранить хоть в Postgres + Redis (шардированный по регионам), и иметь вполне себе хорошую производительность. Проблема будет именно с сообщениями.

Если решать проблему по логике "почему бы не стремиться к 8 млрд пользователей", для профилей можно взять Aerospike или Tarantool. Оба решения имеют возможность шардирования по вторичным ключам, так что их можно разнести по разным регионам. Причём надо именно шардироваться, а не только реплицироваться. Таким образом, можно избежать "узких горлышек". В этом случае оба решения будут выдавать более миллиона запросов в секунду на один кластер с маленькой задержкой (скорее всего двухзначной в медиане) и не иметь единой точки отказа.

С сообщениями сложнее, так как их будут петабайты. Тут советую не "изобретать велосипед" и взять ScyllaDB, как это сделал Discord. ScyllaDB работает с огромными массивами данных довольно быстро и прекрасно масштабируется. Ради двухзначных чисел задержки в медиане достаточно шардироваться по регионам.

Выводы очень простые. Если "стремиться к 8 млрд пользователей" надо
1 - использовать нереляционные СУБД
2 - шардировать БД по регионам (тогда можно отказаться от очередей)
3 - использовать кэширование "горячих" данных
4 - использовать Write-Optimized СУБД для больших массивов данных.

Если у Вас "8 млрд пользователей" Вы можете позволить себе по датацентру в каждом регионе, поэтому основной задачей является правильное шардирование. И ещё один совет. Если гнаться за производительностью, надо использовать не очереди сообщений, а многопоточные асинхронные серверы, которые "кучкуют" сообщения пачками, чтобы как можно реже обращаться по сети.

Архитектура кластера баз данных для географически распределенного проекта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт