Почему gRPC сервис при нагрузке выдает 1 RPS, при том что сервис запущен с max_workers=10?

Question

LakeForest @LakeForest

Python
RPC

Почему gRPC сервис при нагрузке выдает 1 RPS, при том что сервис запущен с max_workers=10?

Я написал тестовый сервис для того, чтобы убедиться, что сервис выполняет запросы параллельно:

class MyService(test_pb2_grpc.MyService):
    async def Method(
        self, request, context: grpc.ServicerContext
    ):
        time.sleep(1)
        return test_pb2.Response()

async def run_serve():
    server = grpc.aio.server(
        futures.ThreadPoolExecutor(max_workers=10)
    )
    test_pb2_grpc.add_MyServiceServicer_to_server(
        MyService(), server
    )
    server.add_insecure_port("0.0.0.0:9000")
    await server.start()
    await server.wait_for_termination()

if __name__ == "__main__":
    asyncio.run(run_serve())

Тестировал через locust с нагрузкой 50u/s ,50 секунд.
Результаты:
RPS=1, средняя скорость ответа = 25 секунд, запросов обработал 50.
Ожидал:
RPS=10, запросов обработано >~500.

Подскажите, пожалуйста, в чем проблема? Почему так?
UPD:
А понял, это для задач отличных от async-io, но как тогда правильно написать time.sleep(1), чтобы ощущался прирост скорости за счет async?

Вопрос задан более двух лет назад
173 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Существуют ли сервисы: онлайн python editor для совместного использования?
- 1 подписчик
- вчера
- 83 просмотра
2

ответа
Python

Простой
На каком языке пишут описание функций в Python?
- 1 подписчик
- 26 сент.
- 263 просмотра
3

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 235 просмотров
1

ответ
Python

Простой
Как парсить pdf-ки с вк с помощью Python?
- 1 подписчик
- 16 сент.
- 324 просмотра
1

ответ
Python

+1 ещё

Простой
Почему возникает синтаксическая ошибка: invalid decimal literal?
- 1 подписчик
- 15 сент.
- 171 просмотр
2

ответа
Python

+1 ещё

Простой
Почему модель обнаружения объектов YOLO работает медленно?
- 1 подписчик
- 14 сент.
- 192 просмотра
1

ответ
Python

Простой
Что можно улучшить или оптимизировать в коде, чтобы он не был таким длинным?
- 2 подписчика
- 10 сент.
- 438 просмотров
4

ответа
Python

+3 ещё

Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
- 1 подписчик
- 09 сент.
- 170 просмотров
0

ответов
Python

Простой
Как получить из URL имя страницы?
- 1 подписчик
- 08 сент.
- 199 просмотров
2

ответа
Python

+1 ещё

Простой
Почему у Python проблемы с форматированием?
- 1 подписчик
- 08 сент.
- 231 просмотр
1

ответ
Показать ещё Загружается…

Python developer

Digital Clouds

от 160 000 ₽

Python разработчик

Selecty

от 280 000 до 380 000 ₽

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2022-12-08 13:19:11

Совершенно непонятно, как именно отрабатывает асинхронный сервер asyncio с вашим thread pool, я так понимаю это скрывается в дебрях класса объекта test_pb2_grpc? Нужно больше информации.

если к правильно настроенному 10-поточному серверу попытаться одновременно сделать больше 10 подключений, то все лишние будут откладываться в очередь (длина которой отдельный разговор, но при ее превышении сервер должен возвращать ошибки) и копиться там, т.е. с какой бы скоростью запросы к серверу не шли бы, отрабатывать они должны именно так - 10 запросов, каждый по 1 секунде, т.е. 10 запросов в секунду.

Для начала смотри логи и временные метки ответов клиента и запуска sleep на сервере (добавь строчку вывода в лог - sleep запущен/завершен с отладочным идентификатором запроса клиента, который добавь в http запрос), тогда ты будешь видеть время жизни каждого подключения клиента, сколько он висел в очереди asyncio и когда завершился на сервере, возможно тут что то прояснится.

Тут будет что то типа такого - первые 10 запросов (в течении первых 0.2 секунды) запустятся на обработку и завершатся каждый ровно через 1 сек, все последующие тупо будут складываться в очередь, по завершению очередного запроса, т.е. каждый следующий исполненный запрос будет завершаться через 0.02..0.2 секунды,группами, (при условии что запросы равномерны по времени), в порядке отправки этих запросов.

Вести отладку многопоточных приложений напрямую сложно (ведь пауза вносит изменения в структуру и порядок запросов), только тщательным логированием

Почему gRPC сервис при нагрузке выдает 1 RPS, при том что сервис запущен с max_workers=10?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт