Как найти причину падения сервера?

Здравствуйте! Есть сервер на Ubuntu 15.04, на нём висит несколько очень ресурсоемких приложений на java (openjdk-8-jre). Периодически происходит полное зависание сервера, при этом по ssh он недоступен. Приходится просить хостера его экстренно перезагрузить. Как отследить причину?
  • Вопрос задан
  • 1745 просмотров
Пригласить эксперта
Ответы на вопрос 4
sim3x
@sim3x
less /var/log/syslog
Ответ написан
Комментировать
gbg
@gbg Куратор тега Linux
Любые ответы на любые вопросы
Есть мнение, что сервер просто попадает в свап. Проследите за этим.
Ответ написан
Комментировать
leahch
@leahch Куратор тега Linux
3D специалист. Dолго, Dорого, Dерьмово.
Если сервер имеет BMC, а должен по идее, иначе какой он сервер. То попросить провайдера подключить его к сети по vpn или еще как. Тогда и провайдера просить не нужно, и можно посмотреть что в консоли происходит. А происходить может обыкновенный кернел-трап, дамп которого можно увидеть только с консоли.
Ну и если у нас недосервер без BMC, то при очередном фейле попросить фото консоли. Ну и логи удаленно писать и статистику собирать через collectd + influxdb + grafana.
Сервера перестаю на ssh отвечать из-за аппаратных проблем обычно. Ны а сами проблемы, от дисков до памяти в промежутках адаптеры, процессоры, далее везде.
Ах, еще может быть кернел дидлок, но это только в консоли смотреть. А еще может и драйвер какой кривить...
Для удаленных логов и статистики арендуйте долларов за 5 виртуалку где нибудь на DO.
Ответ написан
Комментировать
@hofry
установите atop, с его помощью можно мониторить рессурсы, важной особенностью является возможность сохранения данных в файл, который после ребута можно посмотреть
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы