Не скажу за NodeJS, но вообще по идеологии MongoDB достаточно подключиться к одному из серверов в реплике, а он отдаст клиенту информацию о репликах. Лучше, конечно, все реплики указать, чтобы приложение могло подключиться к базе если какая-то из них ляжет. В других языках можно было указывать список реплик просто через запятую.
Autoscaling — это добавление/уничтожение инстансов в зависимости от нагрузки. Полгода назад настраивалось только через консольные утилиты, да.
Вам скорее всего нужно сделать AMI с инстанса и запустить еще один инстанс. Потом создать Elastic Load Balancer (это простой балансировщик нагрузки на haproxy) и добавить их туда. Это все можно сделать через веб, насколько помню.
160Гб — это Ephemeral store, локальный диск железки. Он раза в 4 быстрее чем EBS, выдерживает перезагрузку, но исчезает при poweroff. Автоматом монтируется обычно в /mnt.
За EBS платим отдельно за размер раздела + дисковые операции.
Также напоминаю, что отдельная оплата за сетевой трафик, и по-моему, весьма не хилая по сравнению с любыми другими хостерами.
Если сервера уже как-то создаются и управляются, и стоит задача просто хранить данные о текущем состоянии серверов для использования приложениями, можно или подключиться к (уже имеющемуся ведь?) инвентарю шефа/паппета/ансибла/т.п. или, например, посмотреть на какую-нибудь CMDB типа etcd или serf.
С появлением http://docker.io/ такие платформы будут появляться как грибы после дождя — я у них в новостях видел ссылки на штук 10 наверное, которые на нем основаны.