1. Смысл использовать AWS есть. Но в первую очередь ваше приложение само должно быть масштабируемым – сервер должен быть stateless и не хранить никаких данных локально (в том числе пользовательские сессии), на AWS должен быть настроен ELB который будет распределять трафик между вашими инстансами. Если все упирается в базу данных – тогда для нее можно сделать read-реплики, например.
2. T2 инстансы не умеют масштабироваться сами по себе. T2 это самые простые машинки, которые имеют ограничения по времени максимальной нагрузки на них – в терминах амазона это назвается CPU Credits. Cмысл в том, что вы можете давать нагрузку выше 20% (для разных типов этот порог разный) только в течение определенного времени (час, два, больше – опять же, для разных инстансов это время различается), после истечения которого ваш инстанс опустится до базовой производительности (то есть, довольно низкой).
Короче говоря – T2 держит пики, но не держит длительную нагрузку.
Для динамического масштабирования вы можете с помощью Cloudwatch ловить увеличение количества потребляемых ресурсов и давать команду ASG поднять еще инстансов (или опустить, если нагрузка упала). Можно делать то же самое используя свой собственный мониторинг и AWS API для управления облаком.