Наилучшая архитектура для back-end коннектора к различным API?

Question

Олег Абражаев @seyfer

php

Наилучшая архитектура для back-end коннектора к различным API?

Добрый день.

На данный момент существует система, которая является коннектором к нескольким апи со сложной бизнес логикой в промежутке между получением запроса, отправкой в API и ответом.
Я хочу переписать эту систему для обеспечения более высокой производительности, отказоустойчивости и возможности масштабирования.
Выше перечисленное - это требования.

Теперь задача.
Есть несколько внешних клиентов для back-end коннектора. Клиенты могут отправлять запросы в определенном формате. От каких-то клиентов больше, от каких-то меньше, все приходят на один порт. Назовем запрос от клиента Port Request.

Далее система должна осуществлять предобработку запроса, логирование и по некой бизнес-логике параллелить запрос на несколько. Эти несколько новых запросов назовем Worker Request. В них содержаться уже данные для отправки в конкретный API и они должны выполняться параллельно либо асинхронно.

В это время головной процесс ждет ответа от каждого Worker Request.
По получению всех ответов (или ошибки по таймауту от каких-то API) головной процесс должен проводить пост обработку и сформировать из всех ответов Worker Request один ответ Port Request, залогировать его и отдать клиенту.

Так должен выполняться один цикл обработки одного запроса от клиента.

Запросов есть несколько типов и одни запросы могут быть зависимы от данных предыдущих запросов (т.е. например на одном из запросов на предпроцессинге надо выбрать данные из БД по ИД от предыдущего запроса). Следовательно логи запросов является так же рабочими единицами, которые должны храниться как минимум 30 дней.

-------

Ниже следует описание текущей системы.

Текущая система работает в точности как описано в ТЗ, но реализация не оптимальна. Используется php + mysql. Mysql играет роль как хранилища, так и очереди. Приходящий в контексте web сервера Port Request пишется в БД, далее бизнес логика генерирует Worker Request (N шт), они тоже пишутся в БД. Далее их подхватывает демон в консоли и параллелит через форки используя библиотеку Spork. При взятии из БД Worker делается выборка с блокировкой до обновления. Так же используется memcached для кеширования ответа каждого Worker.

Плюсы данного решения - логи в БД, т.е. можно посмотреть логи запросов.
Минусы данного решения в той же БД, я вижу, что масштабирование затруднительно, вся нагрузка ложиться на БД (много записи и чтения).

------

Суть этого в опроса в идеях и предложениях - как решить задачу наилучшим образом? Какие использовать подходы (очереди, форки, демоны) ? Какие инструменты (gearman, redis, библиотеки) ? Технологии (сейчас php, можно другие) ?

Сейчас я смотрю в сторону таких решений:

Логи запросов писать в Mongo. (Логи в бизнес логике являются так же рабочей единицей и по ИД Port Request или Worker Request берутся данные для работы.)
Очередь организовать через Gearman (или др). (тут не понятно не создаст ли это owerflow над текущим решением, т.к. логи все равно писать придется)
Не понятно как парралелить Worker, оставить так же форки или же сделать вторую очередь. Первая очередь - Port Request, вторая - Worker Request.

Вопрос задан более трёх лет назад
2671 просмотр

Комментировать

Подписаться 6 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack веб-разработчик на JavaScript и PHP

20 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Skillbox

PHP-разработчик. Базовый уровень

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

10 комментариев

Олег Абражаев @seyfer Автор вопроса

Тут не только в запись упираюсь, но в чтение. Эти самые логи являются как логами, так и рабочей единицей. Т.е. по ИД лога Port Request или Worker Request работает бизнес логика, берутся данные. Это должно быть понятно из описания.

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Олег Абражаев: это не понятно из описания раз, представляется мне не правильным два.
В кортеже данных который приходит из очереди должна быть вся необходимая информация для работы.

Написано более трёх лет назад
Олег Абражаев @seyfer Автор вопроса

Дмитрий Энтелис: вы пожалуйста в задачу вникайте. Запрос имеет не один тип, всего типов несколько и они зависят друг от друга (у них есть последовательность, например бронирование, а потом выкуп).

Следовательно зависимые по очередности запросы берут данные из предыдущих (у нас есть один запрос - выдача вариантов бронирования, значит запрос на бронирование должен знать ИД, что выбрал пользователь, далее надо залезть в БД, чтобы взять данные с предыдущего запроса для подготовки текущего запроса).

Я не просто так написал про препроцессинг и постпроцессинг в ТЗ, это важно. Запросы могут быть связаны и данные о предыдущих запросах из БД могут быть нужны. Это и лог и рабочая единица, поторяюсь.

Чаще всего выборка по ИД, поэтому смотрю на Mongo.

Написано более трёх лет назад
Олег Абражаев @seyfer Автор вопроса

Дополнил ТЗ

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Олег Абражаев: про последовательные запросы у вас как не было ни слова, так и нет.
мне кажется что если несколько запросов идут четко последовательно - то может быть вообще нет смысла их разделять? В вашем примере "бронь-выкуп" это в принципе одно действие с точки зрения внешней бизнес-логики.
Или вы сначала делаете пачку броней, потом смотрите какая выгодней, потом выкупаете какую-то одну?
На прошлом highload был интересный доклад от aviasales www.highload.ru/2013/abstracts/1232.html посмотрите, может быть Вам поможет.
У них сложный вариант, там как раз вопросы связанности и общения демонов обсуждаются.

PS ну и в любом случае монга тут будет делать сплошные тормоза. монга хорошо когда надо что то записать и потом когда нибудь посчитать какую нибудь статистику через mapreduce. У вас же будут равноправные потоки на запись/чтение. Это redis лучше. Если хочется потом аналитику можно как обработает задача - класть её в монгу на длительное хранение.

Написано более трёх лет назад
Олег Абражаев @seyfer Автор вопроса

Дмитрий Энтелис: понял ваше мнение на счет mongo.
А на счет запросов я по моему добавил и описал предельно ясно.
Четкой последовательности нет, выполняются они отдельно. Клиент может выкупить бронь и через неделю и через две.
Мы обсуждаем не изменение задачи, а решение для текущей поставленной задачи.

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Олег Абражаев: а, т.е у вас это все еще и разорвано по времени...

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Олег Абражаев: мне кажется у вас именно в логике архитектуры все как то перепутано.
Есть быстрые очереди когда надо что то раскидать по параллельным потокам, обработать, смержить, отдать наружу. Есть долгие истории когда бронирование выкупается через 2 недели.
Это принципиально разные вещи которые не стоит хранить в одном месте.

Написано более трёх лет назад
Олег Абражаев @seyfer Автор вопроса

Дмитрий Энтелис: в данном случае я вас понял, вы предлагаете долгосрочные запросы обрабатывать иначе (отдельно). Но одно из требований к системе - запросы должны выполняться единообразно. У них единый цикл прохода всех этапов. И хранить быстрые все равно придется, т.к. долгосрочные зависят от быстрых (данные).
Вопрос с тем, чтобы выделить быстрые очереди должен решаться масштабированием.

Написано более трёх лет назад
Олег Абражаев @seyfer Автор вопроса

Дмитрий Энтелис: в логике не перепутано, архитектура построена в итеративном процессе в соответствии с решаемой задачей. Вопрос только в оптимизации решения.

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

API

Простой
API Avito передача x-avito-messenger-signature в Webhook по какому алгоритму?
- 1 подписчик
- вчера
- 80 просмотров
0

ответов
PHP

+1 ещё

Простой
Почему перестала работать ЮКасса?
- 1 подписчик
- 19 окт.
- 220 просмотров
1

ответ
API

Простой
На каком языке лучше писать api (читайте описание)?
- 1 подписчик
- 17 окт.
- 235 просмотров
2

ответа
PHP

Простой
Как вычислить результат математических операций в строке?
- 1 подписчик
- 17 окт.
- 229 просмотров
3

ответа
PHP

Простой
Можно ли в PHP вкладывать однострочные комментарии // в многострочные /* */?
- 1 подписчик
- 16 окт.
- 210 просмотров
4

ответа
PHP

+1 ещё

Простой
Перестал работать php запрос к телеграмм?
- 1 подписчик
- 15 окт.
- 216 просмотров
1

ответ
PHP

+2 ещё

Простой
Как проще отправить изображение на стену канала?
- 1 подписчик
- 15 окт.
- 144 просмотра
1

ответ
PHP

Простой
Как точно работает скрипт на RoadRunner?
- 1 подписчик
- 13 окт.
- 207 просмотров
1

ответ
PHP

+1 ещё

Простой
Стоит ли использовать файловый сервер в проекте?
- 2 подписчика
- 13 окт.
- 248 просмотров
3

ответа
PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт.
- 266 просмотров
3

ответа
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 180 000 до 250 000 ₽

PHP-разработчик (Symfony)

Мегаплан

от 160 000 ₽

Разработчик PHP | WordPress

Globaldrive

от 150 000 ₽

Answer 1 · 2014-11-10 08:33:32

1. Логи в mongo - я регулярно вижу пачки статей как в монго все хорошо - но на практике оно у меня легло на вставку при нагрузке ~500 больших json в секунду.
Это было года два назад, может что то допилили - но протестируйте этот момент сами).
Если Вы реально упираетесь в запись логов, я бы придумал какой то буфер в redis или даже mongo с периодической (раз в n минут) выгрузкой в классический sql.

2. Rabbitmq, redis, Gearman

3. По поводу || : я считаю что очереди это однозначно правильно.

Все imho)

Answer 2 · 2014-11-10 08:44:50

_ _ @AMar4enko

Логи запросов писать в Elasticsearch

Ответ написан более трёх лет назад

1 комментарий

Наилучшая архитектура для back-end коннектора к различным API?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт