Поиск причин падения сервера на FreeBSD

Question

pmurzakov @pmurzakov

Системное администрирование

Поиск причин падения сервера на FreeBSD

Сервер работал-работал и внезапно перестал отвечать(http,ping,ssh,ftp — без результатов).
Позвонили в хостинговую компанию. Они сказали, что сервер наглухо завис, сейчас его перезагрузили и теперь всё снова работает.

Закончилось всё хорошо(перезагрузили оперативно), но хотелось бы понять, где искать причины падения?

В /val/log/messages последним было несколько неудачных авторизаций от root по ssh(вещь стандартная — боты постоянно пытаются подобрать пароль к root'у, который запрещён) и следующее:

Feb 26 16:09:57 client monit[71718]: monit: Socket 5 close failed -- Connection reset by peer

Feb 26 16:52:11 client kernel: mfi0: 31687 (352053149s/0x0020/info) - Patrol Read complete

после этого записи уже после перезагрузки

в /var/log/dmesg.today так же ничего интересного.

Подскажите, пожалуйста, где ещё можно найти что-то полезное?

P.S. по результатам можно было бы составить краткое How To :)

Вопрос задан более трёх лет назад
4634 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Системный администратор

11 месяцев

Далее
Академия Эдюсон

DevOps-инженер + ИИ

7 месяцев

Далее
Skillbox

Системный администратор с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

5 комментариев

pmurzakov @pmurzakov Автор вопроса

в last всё только своё.
а «скрин зависона»… что-то в таких случаях может вывестись на консоль?

на сервере стоит nginx+php-fpm. Apache снесли, т.к. не справлялся. (при большой нагрузке начинал уходить в состояние, когда в kernel mode использовал почти 100% ЦП и после спада нагрузки из этого не возвращался)

ОЗУ вроде пока всегда хватало.

Написано более трёх лет назад
pentarh @pentarh

Скрин зависона обычно грамотные хостеры высылают в случае, соответственно, зависона.

Вдруг этот ваш драйвер mfi глюкнул, диски отвалились и последний крик ядра не попал на диск. В этом случае может быть полезен скрин консоли. Да он вообще полезен

Написано более трёх лет назад
equand @equand

Пускай паники сделают скрин и то хлеб. У нас обнаруживались ошибки в igb.
Feb 24 03:01:29 cl1123 kernel: interrupt storm detected on «irq16:»; throttling interrupt source
Feb 26 03:00:38 cl1123 kernel: mfi0: 8252 (352004400s/0x0020/info) — Patrol Read started
Feb 26 03:00:38 cl1123 kernel: mfi0: 8253 (352004400s/0x0001/info) — Consistency Check started on VD 00/0
Feb 26 03:00:38 cl1123 kernel: mfi0: 8254 (352004400s/0x0020/info) — Patrol Read complete
Feb 26 04:49:28 cl1123 kernel: mfi0: 8587 (352010929s/0x0001/info) — Consistency Check done on VD 00/0
Feb 27 03:06:29 cl1123 kernel: interrupt storm detected on «irq16:»; throttling interrupt source
Feb 27 20:50:29 cl1123 kernel: interrupt storm detected on «irq16:»; throttling interrupt source
irq16 это как раз райд — mfi0.
Нагрузки на него 0.0 ибо пишется один файл.

Написано более трёх лет назад
pentarh @pentarh

Что то в фрибсд как то хреново с этими mfi,mpt. У меня парк серверов DELL с RAID контроллером Perc 6/i. Когда делаешь харварный рейд и фряха его цепляет на драйвер mpt, то при определенной нагрузке файловая система по тихоньку начинает крошиться и исходит на гавно в конце концов. С софтовым же рейдом все впорядке, в Линуксе с этим же железячным рейдом проблем замечено не было. А фря напостой подставляет :(

Написано более трёх лет назад
equand @equand

Не знаю от чего зависит. Райд от LSI под этим же драйвером mfi на Sun работал как часы о_О полгода (raid 10 был). Тоже на фре.

Написано более трёх лет назад

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Windows

+1 ещё

Простой
Как в windows повесить две службы на один порт? Или как заменить порт в зависимости от источника?
- 3 подписчика
- 08 июл.
- 363 просмотра
4

ответа
Windows

+2 ещё

Простой
Почему отваливается принтер по USB?
- 3 подписчика
- 10 июн.
- 702 просмотра
3

ответа
Системное администрирование

Средний
Прыгает пинг в играх при идеальных показателях до DNS Google (0% потерь, джиттер 2мс) Что делать?
- 1 подписчик
- 22 мая
- 344 просмотра
3

ответа
Системное администрирование

+1 ещё

Простой
Как запретить внешние HDD в каспере?
- 5 подписчиков
- 15 мая
- 785 просмотров
1

ответ
Windows

+2 ещё

Средний
Как восстановить настройки по умолчанию брэндмауэра Windows 7?
- 1 подписчик
- 13 мая
- 320 просмотров
1

ответ
Системное администрирование

+1 ещё

Средний
Youtube через smart TV в 2026году?
- 1 подписчик
- 10 мая
- 567 просмотров
3

ответа
Системное администрирование

+1 ещё

Простой
Что может значит «Количество SIP линий» в облачной АТС в настройках SIP-аккаунта (фото прилагается)?
- 2 подписчика
- 29 апр.
- 278 просмотров
2

ответа
Системное администрирование

+2 ещё

Средний
Как дать дефолтному пользователю 1С 8.3 право на загрузку XML?
- 3 подписчика
- 27 апр.
- 334 просмотра
1

ответ
Системное администрирование

+3 ещё

Средний
Вопрос к инженерам систем мониторинга и DevOps: приоритизация данных в Dashboard?
- 2 подписчика
- 25 апр.
- 312 просмотров
1

ответ
Системное администрирование

+1 ещё

Средний
Почему настройки RRAS и клиента разные, если они одинаковые?
- 1 подписчик
- 20 апр.
- 240 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2011-02-28 15:29:52

last левые логины выдает?
в следующий раз попросите скрин зависона — зависон завсиону рознь.

Если в своп ушел, надо искать причину чрезмерного потребления памяти. Зачастую это бывает апач, у которого maxclients выставлен далеко за пределы физических возможностей сервера.

У меня фря на парочке серверов почему то последнее время зачастила самопроизвольно перегружаться…

Answer 2 · 2011-03-01 22:58:12

Какая платформа?
У нас на Интеловской платформе штормит на irq райда. Продиагностировать пока не смогли ибо машина runtime и кое как работает… По-мимо этого еще при высокой нагрузке на сетевухи отваливается сеть. И машина иногда перегружается от высокой нагрузки. С температурой по данным RMM3 все отлично. RMM3 на время перегрузки пишет хрень какую-то, так что инженеры Интел попросили провести анализ в EFI…
Забыл добавить, это одна из последних топовых моделей.
Очень разочарованы в Интелах после этого…

Поиск причин падения сервера на FreeBSD

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт