Нужен коллективный разум, идеи кончились.
Есть такой комп
AMD Athlon 64 X2 Dual Core Processor 5000+
Asus M2A-VM HDMI
Seagate ST320DM000
оперативка hunix 2x512
Стоит на нём убунта 12.04 и максимум что на нём используется, это хром с несколькими вкладками.
Достаточно часто этот комп виснет намертво, т.е. экран замирает и даже мышка не двигается. Какой-то закономерности в этих зависаниях я не вижу, бывает несколько часов работает, бывает несколько минут. Лечится только кнопкой reset до следующего раза.
Я гонял все возможные тесты, проверял память, жёсткий диск, гонял sysbench, ни разу не завис к сожалению =) Температура процессора выше 40 градусов не поднимается.
Когда он виснет, к нему возможно зайти по шелу, он живой. Никаких записей в dmesg нету.
Есть идеи?
Вопрос в том что может напряжение (к примеру 3.3в) берет и пропадет, или внезапно проседает? Я просто один раз такую картину видел. Попробуйте другой БП, чтобы точно отсеять эту возможную причину.
+ M2A-VM шибко не новая материнка, может конденсаторы или стабилизатор напряжения на ней? Опыт показывает что такие зависания происходят или из-за перегрева или из-за проблем с питанием.
Все так, если бы вис наглухо или каждый раз по разному. Но если графический интерфейс падает, а процессор и всякая прочая переферия в том числе езернет работает — как-то не очень логично.
Это что, реальные показатели? Чем измерялись? Нормальным мультиметром? Если это реальные показатели — то блоку питания прямая дорога на помойку. В любом случае, следует протестировать систему с другим блоком питания.
И если из шела грохнуть иксы вместе с gdm(или lightdm, не помню). Мышка оживает, но дальше чёрного экрана ничего не уходит. Хотя иксы в обычном состоянии нормально поднимаются.
UPS не стабилизатор, если сеть фонит, но напряжение не пропадает, то всё доберется до компьютера. Можно проверить с стабилизатором, в принципе даже можно сетевой фильтр подобрать (жаль, что многие производители откровенно говоря… (обманывают) и никакие фильтры не ставят, продают удлинители в лучшем случае с предохранителем). По возможности попробуйте отключить всё остальное оборудование на линии.
Вообще поглядите показатели напряжения при полной нагрузке, как будет проседать.
Раз комп продолжает, по сути, работать, то либо графическая подсистема либо что-то софтовое (опять-таки с графикой возможно связанное). Поставить внешнюю видяху, посмотреть что будет.
У знакомого была подобная проблема — как оказалалось, причина в БП, тот был загрязнен, перегревался и комп вис. посмотрите, почистите железо.
И попробуте memtest прогнать, мало ли.
у вас определено аппаратная проблема и здесь надо смотреть связку графика-БП. Греется ли карта? Может банально куллер надо смазать, а может и правда проблема в напряжении, но копайте в эту сторону.
Посмотрите еще Xubuntu. Возможно все же что-то конфликтует между убунтой и видео у вас. В Xubuntu мне кажется другая оболочка, плюс к ресурсам менее требовательна, а плюшке все те же.
Я обычно что делаю:
1. Полный разбор, чистка всех разъемов
2. Мониторинг напряжений и температуры под нагрузкой
3. Проверка конденсаторов (электролитиков) на вздутие, себе стараюсь сейчас брать с твердотельными
4. Проверка с другим БП
5. Дальнейшая проверка с другими компонентами.
у вас в ОС включено управление частотой процессора? если да, попробуйте поставить в режим максимальной производительности.
если это поможет — пишите, где-то у меня валяется рецепт…
как раз fzfx и пишет, что проблема вознивает именно в простое и предлагает пока отключить энергоэкономию у проца выставив не on demand, а performance.
Это легко можно сделать, выкатив в трей значок частоты процессора — и в нём в меню переключить режим.
Например, когда проц уходит в самый глубойкий режим «отдыха» и вешается. Тот же глюкавый C1E — если есть его упоминание в БИОСе — то отключите его. forum.ubuntu.ru/index.php?topic=124234.0
C1E был выключен. В scaling_governor вставил performance, было ondemand. Заметил что если в биосе выключить cool'n'quiet, все настройки с частотой вообще пропадают. Может вместо performance выключить это совсем?
Да, я выше неудачно выразился. Действительно, я имел ввиду, что вам стоит проверить, сохраняется ли ошибка, если комп работает в performance. У оптеронов на 940 сокете была errata, согласно которой мне пришлось использовать MSR-патч как-то раз на сервере со схожей симптоматикой.