В общем пришлось оптимизировать свой велосипед, но связать его с редисом как с дублирующим хранилищем...
В процессе работы "велосипед" дублирует все операции по созданию/удалению записей в редис, а в случае падения или рестарта, он из редиса загружает сначала весь "дамп данных" с учетом поступающих изменений в процессе инициализации из редиса.
Стало поустойчивее и нагрузку поболее держит без риска потери быстрых данных. Скорее всего, это инвалид на костылях, но узким местом сейчас стал только сетевой интерфейс и канал до клиентов, если клиент слишком много хочет читать реалтайм, то канал к этому клиенту должен быть настолько толстым, чтобы данные прокачивались без потерь и задержек, иначе пока данные дойдут, могут стать просто неактуальными =)
Всем спасибо за поддержку и подсказки!