Из того, что можно изучить и потренироваться без реального опыта с "живыми" системами:
- DB performance tuning - например по постам в блоге Percona
- DB scaling - для записи, для чтения, вертикально/горизонтально
- как писать "быстрые" запросы, как анализировать запрос
- индексы - плюсы и минусы, как понять какие нужны
- мониторинг - по каким критериям мы понимаем в чем bottleneck
По всему этому есть много достаточно систематического материала.
А дальше - читать
highscalability.com, плюс postmortems в блогах разных компаний, и т.д.