Приветствую!
Ночью, после 12 часов сервер перестаёт отвечать на запросы, пингом пакеты до него не доходят, к шеллу тоже не подключиться.
Есть kvm, подключаясь через него виден бесконечный вывод таких строк:
Unit systemd-journald.service entered failed state.
systemd-journald.service has no holdoff time, schelduling restart.
Stopping Journal Service...
Starting Journal Service...
Started Journal Service.
systemd-journald.service watchdog timeout (limit 1min)!
Лечится только перезагрузкой через тот же kvm. В гугле ничего внятного не нашёл.
На сервере крутится сайт средней нагруженности (LAMP), несколько докер контейнеров.
В чём может быть проблема? Какие логи посмотреть чтобы разобраться в чём беда?
UPD:
Такой вывод в /var/log/messages чётенько во время сбоя:
/var/log/messages (yadisk)
Вывод syslog с момента сбоя до перезагрузки
/var/log/syslog (yadisk)
ATOP продолжает работать даже во время сбоя
Вывод atop за 10 минут до сбоя Вывод atop через 1 минуту после сбоя Вывод atop через 10 минут после сбоя