В настройках приложения можно выбирать max idle instance. Если указано значение 1, то можно ли рассчитывать, что все запросы будут идти к одному инстансу и соответственно использовать его оперативную память в качестве кеша, защищенного от коллизий.
В моем случае меня не пугает периодическая потеря данных, связанная со схлопыванием инстанса, но я должен точно знать, что данные не распределятся между несколькими инстансами. Могу ли я на это рассчитывать при таких настройках?
В хелпе сказано, что в некоторых случаях фактическое кол-во задействованных инстансов может превышать максимальное кол-во ожидающих инстансов из настроек.
Так что, ответ: нет.
Нет, из опыта могу сказать что либо на 100% сказать нельзя для GAE. Во-первых контролировать время жизни инстанса невозможно, и если не поступает запросов то GAE убивает инстанс. Во-вторых даже если проплатить чтобы держать инстанс горячим часто бывает что GAE перезапускает инстанс (подозреваю чтобы память не текла). Лучше писать все в threadsafe, а в вашем случае использовать memcache.
P.S а вот в инстансах которые backend живут очень долго, да и лимитов там почти нет которые присущи обычным front-end типам.