Как параллельно обрабатывать API запросы?

Question

Ainvain @Ainvain

Python
API

Как параллельно обрабатывать API запросы?

Пытаюсь написать сервис для классификации текста (для чат-бота). Есть желание сделать его многопоточным, чтобы поднять производительность.
Насколько понял, waitress создает несколько потоков для обработки запросов. Но в запросах используется один и тот же объект classific (модель для классификации). При этом внутри объекта хранятся словари для котроля контекста диалога в рамках сессии (по session_id). Допустим, их можно вынести отдельно.

import argparse
import yaml
from waitress import serve
from flask import Flask, request
from flask_restful import Api, Resource, reqparse
app = Flask(__name__)
api = Api(app)

class Detect(Resource):
    def post(self):
        parser = reqparse.RequestParser()
        parser.add_argument("session_id")
        parser.add_argument("phrase")
        params = parser.parse_args()

        return classific.detect_intent(
            phrase = params['phrase'], 
            session_id = params['session_id']), 200
    
    def get(self):
        phrase = request.args.get('phrase')
        session_id = request.args.get('session_id')
        if phrase:
            return classific.detect_intent(
                phrase = phrase, 
                session_id = session_id), 200
        else:
            return "No phrase in request", 400

api.add_resource(Detect, '/', '/detect')
# часть кода опущена

if __name__ == '__main__':    
    args = parser.parse_args()
    lin_model_path: str = args.liner_model_path
    regexp_path: str = args.regexp_path    
    agent_name: str =  args.agent_name

    model = nlu.model(lin_model_path) if lin_model_path else None
    regexp_data = None
    if regexp_path:
        with open(regexp_path, mode='r', encoding='UTF-8') as file:
            regexp_data = yaml.safe_load(file)
    classific = Classificator(linear_model=model, regexp_patterns=regexp_data, agent_name=agent_name)    

    
    print('Запуск сервера')
    serve(app, host=args.host, port=args.port)

Как можно сделать так, чтобы каждый из потоков waitress использовал отдельный, заранее заданный экземпляр Classificator (копия classific), а изменяемые данные (контекст диалога) хранились в разделяемой переменной? Ещё, как вариант, запросы с одинаковым session_id могли бы обрабатываться в одном классификаторе, а разные сессии могли параллельно обрабатываться в разных потоках.

Вопрос задан более двух лет назад
150 просмотров

Комментировать

Подписаться 2 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+2 ещё

Простой
Как по API создать диалог из Телеграм в открытой линии Битрикс?
- 1 подписчик
- 12 часов назад
- 39 просмотров
0

ответов
API

+1 ещё

Простой
Точь в точь ли маппятся поля json-сущности на поля в таблицах базы данных?
- 1 подписчик
- вчера
- 138 просмотров
2

ответа
Python

+1 ещё

Средний
Как генерировать качественные изображения в stable diffusion используя python?
- 2 подписчика
- вчера
- 274 просмотра
0

ответов
Python

+1 ещё

Простой
Какова временная сложность del[pos:] для списка в Python?
- 1 подписчик
- 04 июл.
- 163 просмотра
1

ответ
Python

Простой
Не копятся ли строки в памяти при работе с python?
- 1 подписчик
- 04 июл.
- 185 просмотров
2

ответа
Python

Простой
Как получить детальные данные по лицу с фото?
- 1 подписчик
- 03 июл.
- 117 просмотров
3

ответа
Python

+1 ещё

Средний
Извлечение информации о сохраненных бэкапах в google drive?
- 1 подписчик
- 03 июл.
- 56 просмотров
1

ответ
API

+2 ещё

Средний
Как исправить ошибку загрузки фидео с ВК Загрузка «https://vkvideo.ru/» во фрейме запрещена директивой «X-Frame-Options», установленной в «deny»?
- 1 подписчик
- 03 июл.
- 59 просмотров
0

ответов
Python

Простой
Как вставить переменную в re.sub?
- 1 подписчик
- 03 июл.
- 94 просмотра
1

ответ
Python

+2 ещё

Средний
Почему не отображается inline keyboard при редактировании сообщения?
- 1 подписчик
- 02 июл.
- 549 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python разработчик

DevTeam.Space

от 1 500 до 3 000 $

Стажер Python разработчик, музыкально грамотный

Vocaberry

от 20 000 до 20 000 ₽

Answer 1 · 2022-08-07 13:54:06

Я бы сделал несколько по другому.
Оформил бы отдельно рабочий поток/процесс, и заставил бы их общаться через пару очередей (классический паттерн producer-consumer). Подходящие классы очереди можно найти в multiprocessing (ну или в threading, если ты очень хочешь потоки вместо процессов).

Основной (корневой) процесс запускает рабочие процессы, потом слушает входящие запросы. Получив запрос, кидает его в очередь. Первый свободный процесс извлекает запрос из очереди, обрабатывает, отправляет ответ на запрос, и снова ждёт появления элемента в очереди. Проблема в том, что при использовании процессов придётся передавать между ними сложный объект Request - я не уверен, что это будет просто. Можешь попробовать потоки, но в питоне потоки не всегда хорошо работают.

Нужно будет подумать над тем, где будут узкие места. Я вижу два - собственно работа классификатора, и обмен данными с клиентами. Первое ты обходишь, второе можно отчасти обойти через асинхронную работу (flask это умеет).

Как параллельно обрабатывать API запросы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт