При построении проекта делайте так, чтобы падение нескольких случайных серверов не уронило весь проект.
Если используете балансировщик - значит надо уметь перебрасывать IP на запасной, если основной "ушёл". Если строите базы данных - значит надо автоматически выбирать нового мастера, если старый ушёл в даун, а падение слейва не должно коснуться производительности никоим образом.
Не используйте один сервер для обеспечения работы важных задач, используйте дублирование где только можно.
Ну и следите, чтобы у хостера дублирующие серверы были расположены с разных подсетях, чтобы сервис продолжал работать при неполадках во внутренней сети хостера.
Удачи вам!