Чтобы "можно было безболезненно выключить один из узлов на обслуживание (или при аварийном отключении), а планировщик самостоятельно переехал на другой доступный узел" - добавляют абстракцию между железом и ОС в виде виртуализации/контейнеров.
В таком виде планировщик находится внутри ВМ и в случае аварии/работ переезжает на другое железо, не требуя никакого дополнительного ПО для настройки.