Вы довольно широко описали область. Технические (инженерные, ...) системы вообще и ИТ-системы, особенно программную часть последних, довольно сложно накрыть одним ударом.
По моделированию/оценке/проектированию с т.з. надежности обще-технических систем есть известный труд Patrick P. O'Connor, Andre Kleyner, «Practical Reliability Engineering»:
www.amazon.com/Practical-Reliability-Engineering-Patrick-OConnor/dp/047097981X
Там и теория, и упражнения. Но по ИТ-системам там практически ничего нет, одна глава по надежности ПО (когда на профильных специальностях это минимум целый курс).