Как лучше спроектировать апи с большой нагрузкой?

Question

Vadim Stepanenko @Vadim1899

Как лучше спроектировать апи с большой нагрузкой?

Необходимо разработать высоконагруженное апи, к которому будут почти нон-стопом обращаться партнерские сервисы. Методы апи будут в основном производить записи в бд: партнер вызвал метод апи -> апи сделало проверки -> апи добавило запись в бд -> вернуло true/false партнеру.

Стек: node.js/express.js/pm2

На что можно обратить внимание при проектировании апи? Какие есть потенциальные узкие горлышки? Интересуют советы как по коду, так и по девопсу. Сейчас мыли такие:
1. Будет 1 серв, на котором будет запущено несколько инстансов апи. Запросы между ними будет распределять балансировщик pm2. Так мы увеличим шанс бесперебойной работы, если 1 инстанс упадет
2. В редисе буду кешировать проверки, чтобы лишний раз не грузить бд
3. В редисе буду помечать выполненные операции, чтобы сразу скипать повторные запросы
4. Писать все данные не в основную бд (бд платформы), а во временную бд апи и раз в N минут/часов сгружать данные в основную бд

Может есть что-то еще, что будет очень полезным? Или может какие-то из моих идей бессмысленные?

Абстрактный пример работы апи:
1. в запросе принимать id юзера, id поста
2. проверять, есть ли в бд есть запись с id юзера и id поста
3. если записи нет, то добавлять в бд
4. прочие инсерты и апдейты в бд, по типу "начислить баллов пользователю (обновить баланс и добавить запись в таблицу user_points_changes)"
и все это в рамках одной транзакции с блокировками строк

Вопрос задан более года назад
4414 просмотров

4 комментария

Подписаться 6 Простой 4 комментария

Сергей Горностаев @sergey-gornostaev

Будет 1 серв

Если с нагрузкой может справится один сервер, то эта нагрузка не высокая.

Написано более года назад
szQocks @szQocks

а зачем эта временная бд ?

если достиг предела вертикального масштабирования + pm2, то тут могу лишь посоветовать юзать докер, что бы идти в горизонтальное масштабирование, а там уже всё что за пределы этого хайлоад в этом уже не волоку

Написано более года назад
Антон @anton99zel

Сейчас делаю примерно такое же. Могли бы обменяться опытом, проговорив некоторые моменты. Если интересно, пишите на почту - созвонимся.

Написано более года назад
Gip @Giperoglif

я бы Express заменил на Fastify. Но тут, конечно, дьявол в деталях.

Fastify and Express are both great API frameworks for Node.js. Which one you choose will depend on your specific needs and preferences. If performance is a top priority and you need built-in support for data validation and serialization, Fastify may be the better choice. If simplicity and a large ecosystem of third-party middleware packages is more important, then Express may be the way to go.

Написано более года назад

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
ProductStar

Профессия: Web-разработчик

8 месяцев

Далее
Skillfactory

Профессия Веб-разработчик

12 месяцев

Далее

Решения вопроса 2

3 комментария

Vadim Stepanenko @Vadim1899 Автор вопроса

А где хранить очередь? Если в памяти, то есть риск потерять данные, если инстанс упадет(

Написано более года назад
VoidVolker @VoidVolker

Vadim Stepanenko, Например Redis и дублирование на случай падения основного сервера.

Написано более года назад
Алексей Уколов @alexey-m-ukolov Куратор тега Веб-разработка

Vadim Stepanenko, инстанс может упасть так (и когда-нибудь обязательно упадёт), что данные потеряются откуда угодно. Поэтому, если это важно, нужно делать нормальную настоящую репликацию. И тогда уже можно будет где угодно хранить данные на одной конкретной машине.

Написано более года назад

3 комментария

Vadim Stepanenko @Vadim1899 Автор вопроса

Если в двух словах, то апи будет:
1. в запросе принимать id юзера, id поста
2. проверять, есть ли в бд есть запись с id юзера и id поста
3. если записи нет, то добавлять в бд
4. прочие инсерты и апдейты в бд, по типу "начислить баллов пользователю (обновить баланс и добавить запись в таблицу user_points_changes)"
и все это в рамках одной транзакции с блокировками строк

Написано более года назад
Алексей Уколов @alexey-m-ukolov Куратор тега Веб-разработка

Vadim Stepanenko, зачем проверять, когда есть insert ignore? Это всё равно будет быстрее, чем какая-то внешняя проверка.

Написано более года назад
rPman @rPman

Vadim Stepanenko, sql в пределах одной команды, при использовании индекса, способна делать и проверку на наличие и вставку новых данных

как я уже сказал, не советую использовать одну таблицу, партицируйте штатным или искусственным методом, разделяйте по нодам (например если выбор ноды определить через хеш пользователя, то один и тот же пользователь не будет попадать в разные базы, а значит не потребуется проверять его уникальность по всем нодам, а только в пределах одной).

Разделение по нодам имеет смысл делать если одна не будет справляться, но нагрузочные тесты придется проводить заранее

Написано более года назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+2 ещё

Средний
E2EE + WEB = поищем безопасность?
- 1 подписчик
- только что
- 1 просмотр
0

ответов
Веб-разработка

Средний
Какие есть программы/инструменты для создания веб каталога запчастей?
- 3 подписчика
- 08 дек.
- 441 просмотр
4

ответа
Веб-разработка

Простой
Ограничение в РФ, как обойти и не потерять клиентов?
- 1 подписчик
- 08 дек.
- 460 просмотров
5

ответов
Telegram

+3 ещё

Простой
Какое API можно использовать для просмотра фильмов в тг боте?
- 1 подписчик
- 04 дек.
- 288 просмотров
0

ответов
API

Средний
Не работает api 3x-ui?
- 2 подписчика
- 03 дек.
- 190 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Элемент стилизации на js, как сделать чтобы не было резкой смены картинки фона?
- 1 подписчик
- 27 нояб.
- 221 просмотр
1

ответ
Веб-разработка

+1 ещё

Простой
Как включить ai ассистента в dev-tools в рф?
- 1 подписчик
- 25 нояб.
- 295 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Подойдет ли desktop-ubuntu для разворачивания web- сервера?
- 2 подписчика
- 25 нояб.
- 642 просмотра
5

ответов
WordPress

+2 ещё

Простой
Как создать сайт с музыкой?
- 2 подписчика
- 24 нояб.
- 602 просмотра
5

ответов
Веб-разработка

Простой
Какие есть аналоги иностанных web песочниц типа JSFiddle, codepen ...?
- 1 подписчик
- 16 нояб.
- 377 просмотров
1

ответ
Показать ещё Загружается…

Fullstack Next.js Cursor Developer

Nocodered

от 60 000 до 120 000 ₽

SEO-специалист (Сеть образовательных проектов)

Профессиональный Стандарт • Москва

До 100 000 ₽

PHP / WordPress разработчик ACF, Elementor (удаленный, свободный график)

Nomadic Soft

от 1 200 до 1 800 $

Будет 1 серв

Если с нагрузкой может справится один сервер, то эта нагрузка не высокая.
а зачем эта временная бд ?

если достиг предела вертикального масштабирования + pm2, то тут могу лишь посоветовать юзать докер, что бы идти в горизонтальное масштабирование, а там уже всё что за пределы этого хайлоад в этом уже не волоку
Сейчас делаю примерно такое же. Могли бы обменяться опытом, проговорив некоторые моменты. Если интересно, пишите на почту - созвонимся.
я бы Express заменил на Fastify. Но тут, конечно, дьявол в деталях.

Fastify and Express are both great API frameworks for Node.js. Which one you choose will depend on your specific needs and preferences. If performance is a top priority and you need built-in support for data validation and serialization, Fastify may be the better choice. If simplicity and a large ecosystem of third-party middleware packages is more important, then Express may be the way to go.

Answer 1 · 2024-09-06 18:08:44

Писать все данные не в основную бд (бд платформы), а во временную бд апи и раз в N минут/часов сгружать данные в основную бд

Гораздо проще использовать нормальный сервер очередей. Вдобавок, данные будут быстрее попадать в БД не вися в отстойнике.

Answer 2 · 2024-09-06 18:07:07

Ты не сообщил самое главное - как будут читаться собираемые данные. Будут ли они считываться и тем более фильтроваться в процессе записи, можно ли вводить запаздывание при чтении данных (например до 'некоторых' данных в прошлом).

Если ничего этого нет, то ничего между базой данных и бакэндом ставить не нужно... таблицы, в которые складываются данные должны быть без индексов, можно ввести искусственное партицирование, например таблица без индексов - последние не обработанные данные, вторая таблица - данные с индексами в которых будет проводиться поиск и анализ, для размазывания нагрузки использовать штатную репликацию базы данных, разные ноды - разные задачи. Кстати один из способов партицирования - писать данные блоками, каждый блок в свою новую таблицу, количество таблиц сравнимо с количеством нод, обрабатывающих их данные (таким образом можно отключить даже транзакции, ведь пока обрабатывается таблица, данные пусть пишутся в следующую, управление таблицами вести тут же на таблицах но уже с транзакциями)

Проблема не столько в данных и в их объеме, а в надежности всей схемы, т.е. например можно не делать единую точку отказа и сделать несколько независимых api endpoint, клиенты должны сами переключаться между ними, при ошибках, ну а сам выбор куда подключаться делать случайным.

Кстати, собственно сбор оперативных данных не обязательно делать в ОДНОЙ физической базе, это могут быть разные БД, а вот последующий анализ уже делать следующим сервисом (так же может быть несколько нод), собирающим данные из разных первичных источников в какой то единый или еще в какой то форме... именно подготовка данных к последующему их использованию и есть вопрос реализации.

Настоятельно не советую городить зоопарк из разных баз данных типа редис и sql-db.. когда sql база используется без индексов (и тем более без транзакций) на последовательную запись у нее нет конкурентов (ну только что совсем низкоуровневым программированием заняться)

Как лучше спроектировать апи с большой нагрузкой?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт