Доброе время суток, в офисе стоит сие чудо, в последнее время начал глючить не по детски. А именно периодически отваливаются таргеты, шары и прочее. При этом это собака не пускает в интерфейс по логину и паролю пока его ре рестартанеш. Что делать? я понимаю что ему опа, но до закупки оборудования нужно еще протянуть 2-3 недели
эт понятно, а причина? мать, озу, рэйд контроллер? я конечно сейчас "очень люблю того мудака что выбрал это несколько лет назад в замен схд" и не дай бог ему мне попасться после сегодняшнего на глаза. но за 24 часа я сомневаюсь что найду куда вылить 20тб инфы
Антон Уланов: телепаты-диагносты ушли в отпуск.
smart дисков смотрели? в логах есть что-нибудь про ошибки?
однозначной причины вам никто не скажет.
для этого надо хотя бы поменять харды на заведомо рабочие и протестировать, что опять же выливается в задачу забекапить данные, дабы не потерять.
Wexter: 3 ноды proxmox, на бекапах клали, но быкапы мы перекинули. остались только данных. я начинаю думать о ОЗУ. может она начинает глючить? потому что после ребута 5 минут он стабильно пашет а потом кол
Антон Уланов: точно не ОЗУ, при проблемах с ОЗУ он у вас мог бы даже не загрузиться. какие диски стоят? у разных дисков разные параметры SMART, как бы это печально не было. что то забивает канал и CPU, может какого виря для майнинга споймали или диски стали отваливаться и перешли в режим PIO. что показывает top во время проблемы?
3 ноды proxmox,
вот это больше похоже на проблему, сколько ВМ крутится? какой IOPS? нет ли конфликтов между нодами?
Обновляли и не раз. сейчас last stable 4.3.3 стоит. года 2 в режиме онлайн. как только ее выводим из сети все начинает нормально работать. поэтому не просто так на нее наговариваем. ей не место в нашей фирме, но пока выбора нет
mdmshrm: сейчас мы занимаемся восстановлением данных после его сбоя. Как закончим извлекать данные тогда уже отключим его от сети и будем мониторить что да как с ним. потому что сейчас у нас каждая минута на счету