Как правильно форкнуть процесс в flask?

Question

Максим @usbmonkey

Flask

Как правильно форкнуть процесс в flask?

Привет.
Стоит задача сделать API, под которым будет запускаться скриптик. Скрипт в свою очередь может выполняться очень и очень долго - от 90 секунд. API, как можно догадаться, должен отвечать моментально.
В качестве веб-севера будет выступать nginx с proxy на flask апликацию.
Как удалось выяснить, flask совсем не асинхронный.
Сразу возникала идея форкнуться и выполнять задачу в фоне.

Накидал для пробы:

def start():
	pid1 = os.fork()
	if pid1 == 0:
		os.setsid()
		x = 30
		while x > 0:
			sleep(1)
			with open('/tmp/sleep.log', 'a') as fd:
				pid = str(os.getpid())
				print "child pid = ", pid 
				fd.write(pid  + ' PID \n')
			x -= 1
		os._exit(0)
	else:
		print os.getpid()
		while True:
			pass

start()

В этом примере все замечательно работает. Создается новый процесс, задачка выполнятся в фоне. После завершения дочерний процесс умирает, родительский продолжает работать.

Попробовал перенести под flask:

@app.route('/api/start', methods=['POST'])
def start():
	d1 = "DONE\n"
	pid1 = os.fork()
	if pid1 == 0:
		os.setsid()
		closer() #здесь закрываю все файловые дескрипторы унаследованные от родителя
		x = 30
		while x > 0:
			sleep(1)
			with open('/tmp/sleep.log', 'a') as fd:
				pid = str(os.getpid())
				print "child pid = ", pid 
				fd.write(pid  + ' PID \n')
			x -= 1
		os._exit(0)
	else:
		print os.getpid()
	return d1

Вот что происходит в этом примере:

username    6158  0.0  0.4 106528 26192 ?        S    19:34   0:00 python -u /home/username/VCS/username/seek/lui/tcpdumper/dumper_api.py
username    6165  0.3  0.4 182876 26816 ?        Sl   19:34   0:05 /usr/bin/python /home/username/VCS/username/seek/lui/tcpdumper/dumper_api.py
username    6262  0.0  0.0      0     0 ?        Zs   19:34   0:00 [python] <defunct>

Дочерний процесс сразу становится зомби. Соответственно, в файл ничего не записывается.

Собственно, главный вопрос в том, почему так происходит.
Подскажите, какие еще варианты решения проблемы могут мне подойти.
Смотрел в сторону Tornado, subprocess ( его использовать нежелательно ).
Спасибо.

Вопрос задан более трёх лет назад
532 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Хекслет

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Максим @usbmonkey Автор вопроса

Логика приложения такая, что не важно что происходит с задачей. Будет еще одна ручка, по которой можно посмотреть статус выполнения.
На multiprocess посмотрю еще раз, спасибо. По какой-то причине я отказался от него при первом рассмотрении.

И все таки, почему в моем случае порождается zombie?
И что невменяемого Вам кажется в fork'e ?

Написано более трёх лет назад
thenno @thenno

Почему порождается зомби - Вы уже сами выше написали, повторять вряд ли будет иметь смысл)

fork - низкоуровневая операция, которая только усложняет код. В Python есть более удобные механизмы (тот же multiprocess) - в этом случае как минимум не нужно городить проверок на то, в каком именно процессе мы находимся.

Ответ, который предложили на stackoverflow хорош, для той бизнес-логики, которую Вы описали в этом комментарии - такое решение ближе всего к идеалу.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
- 1 подписчик
- 08 окт.
- 178 просмотров
3

ответа
Flask

Простой
Как связать html-код c python при помощи Flask?
- 1 подписчик
- 20 сент.
- 325 просмотров
1

ответ
Flask

+1 ещё

Простой
Почему не проходит SSO аутентификация?
- 1 подписчик
- 22 авг.
- 145 просмотров
1

ответ
Flask

Простой
Как сделать свой сервер для хранения картинок на flask?
- 1 подписчик
- 18 авг.
- 192 просмотра
2

ответа
ВКонтакте

+1 ещё

Простой
Работа с VK API и как нормально получить токен?
- 4 подписчика
- 11 мая
- 6184 просмотра
4

ответа
Flask

Простой
Почему не отображаются файлы в теге img, html, находящиеся вне папки static?
- 1 подписчик
- 10 мая
- 104 просмотра
1

ответ
Flask

Простой
Как можно запустить другой flask с основного?
- 1 подписчик
- 26 мар.
- 132 просмотра
0

ответов
Flask

+1 ещё

Простой
Почему пишет, что onion сайт не найден в flask?
- 1 подписчик
- 20 февр.
- 258 просмотров
0

ответов
Flask

Простой
Почему Python не импортирует и не видит библиотеки Flask?
- 2 подписчика
- 18 февр.
- 428 просмотров
4

ответа
Flask

Простой
Почему не подключается фласк?
- 1 подписчик
- 31 янв.
- 127 просмотров
1

ответ
Показать ещё Загружается…

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Python разработчик

АВ Софт • Москва

от 200 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

Answer 1 · 2016-03-14 17:33:34

Удалось разобраться в проблеме. Может быть кому-нибудь поможет.

Дело в том, что родительский процесс ждет завершения дочернего ( код возврата ).
Я думал, что вызова os._exit() достаточно и это можно увидеть запустив strace:

16059 --- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=16060, si_status=0, si_utime=0, si_stime=0} ---

Оказалось, что есть нюансы.
Нюанс заключается в следующем. Для родительского процесса нужно установить обработчик сигнала. Сделать это можно использовав библиотеку signal.
signal.signal(signal.SIGCHLD, signal.SIG_IGN)
Первый аргумент - int'вая константа, а второй - действия для сигнала.
После завершения дочернего процесса он уходит в состоянии зомби ( это нормально ), как было в моем случаем. После установки обработчика начинает работать механизм reaping и OS самостоятельно очищает таблицу процессов.

Кстати, на stackoverflow предложили достаточно хорошее решение.
Идея заключается, в том, чтобы сделать демона, который будет смотреть в очередь задач. При этом веб-сервер будет отвечать 202 кодом. Задачки будут разбираться по мере поступления, а статут задачи всегда можно будет узнать по другому URL.

Answer 2 · 2016-03-11 21:38:00

Для начала, в Python есть более вменяемые способы управления процессами - посмотрите модуль multiprocess.

API, как можно догадаться, должен отвечать моментально.

Догадаться не получается, на самом деле:) Очень непонятно, зачем нужна такая логика - сначала ответить клиенту 'ok', а только потом закончить выполнять операцию. Это логически неверно и сбивает с толку в 99% случаев. По-хорошему api должно принять запрос, выполнить действие (хоть меньше секунды, хоть все 90 секунд), а затем ответить клиенту с успехом или нет.

Главное здесь - грамотно настроить nginx (worker_connections и timeout'ы как минимум, возможно, в официальной документации найдется что-то более годное), чтобы в случае множества медленных запросов сервис продолжал нормально работать.

Как правильно форкнуть процесс в flask?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт