Если ваш вопрос касается больше практической стороны, то рекомендую книгу Ли Атчисона «Масштабирование приложений. Выращивание сложных систем». В ней описаны такие понятия как надежность, доступность, матрицы рисков, и также способы решения проблем с ними связанных.
Примеры расчетов метрик в книге также присутствуют.