Аналоги есть. В том числе и платные (например у Cisco). Но из свободного openfire лично мне больше всего подошёл.
Пробовал разворачивать openfire все устраивает, но по неизвестным причинам спустя некоторое время работы просто слетает (то в админку не зайти, то пользователи в оффлайне)
Много пользователей? Ростеры по группам в AD ?
Там настройки кэша по-умолчанию очень неподходящие.
Почитайте:
https://community.igniterealtime.org/docs/DOC-1673
Там в админке в Server->Server manager->Cache Summary видно как кэш используется.
Если один из кэшей для AD забит на 100% и имеет малый процент попадания запросов в кэш - у меня были очень похожие на ваши проблемы.