На сервере 2 cpu, 4 оперативки. Включены 200 работников которые выполняют достаточно продолжительные действия. Когда сайт и работники были на разных серверах кролик не падал, но редиска жрала терабайтами трафик... Пришлось сделать все на одном сервере. Теперь кролик падает, первый раз в день запуска, второй раз 2 дня проработал.
Тоже интересно услышать варианты дебага, но наверно стоит добавить в вопрос больше предыстории - на каком сервере запущен, какие ресурсы выделены, какие задачи возложены на ребит в проекте...
Mikhail Osher, в редисе хранятся данные (настройки пользователя), которые все время проверяются во время работы работника, между серверами передаются несколько терабайт данных в месяц, а брокер нужен для того чтобы обязательльно выполнить процедуры для каждого пользователя в порядке очереди, так как в прошлой версии программы без брокера все было хаотично. Сейчас же все работает как надо, но падает RabbitMQ
Должно быть что-то в логах RabbitMQ и\или системных.
Возможно, другие сервисы бегущие на сервере жрут память и срабатывает kernel out-of-memory-killer.
Если лень ставить нормальный мониторинг, установите хотя бы atop, тогда можно будет проанализировать ситуацию с памятью перед падением.