Используйте pm2 в cluster режиме, мало того, что он будет переподнимать упавшие процессы, он еще и решит Ваши проблему:
Когда Вы даете команду pm2 restart app-name
он перезапускает процессы по очереди (1 погасил, 1 запустил, 2 погасил, 2 запустил, ...)
Как итог - работаем без простоя