@alenov
Программист

Комп виснет наглухо, в логах есть следы, кто может разобрать, в чём причина?

Доброго дня!

Linux Mint
Комп с некоторой периодичностью виснет наглухо, повторяется несколько раз в месяц. Приходится выходить reset-ом. Началось давно.
Полностью менял железо, кроме одной железки - видеокарта NVIDIA GT218 [GeForce 210] (nouveau)
После зависания пару раз заглядывал в логи, но ничего не находил. И вот сегодня опять решил проверить syslog и увидел странное:
Jul 24 14:27:12 main kernel: [153358.688376] nouveau 0000:01:00.0: gr: TRAP_MP_EXEC - TP 0 MP 0: 00000008 [TIMEOUT] at 07dd34 warp 29, opcode c0040000 c0050204
Jul 24 14:27:12 main kernel: [153358.688389] nouveau 0000:01:00.0: gr: TRAP_MP_EXEC - TP 0 MP 1: 00000008 [TIMEOUT] at 07dd34 warp 31, opcode c0040000 c0050204
Jul 24 14:27:12 main kernel: [153358.688392] nouveau 0000:01:00.0: gr: 00200000 [] ch 3 [001fa14000 Xorg[8392]] subc 3 class 8597 mthd 108c data 002affff

---- то же самое много раз ----

Jul 24 14:27:14 main kernel: [153360.513978] nouveau 0000:01:00.0: gr: 00200000 [] ch 3 [001fa14000 Xorg[8392]] subc 3 class 8597 mthd 108c data 002affff
Jul 24 14:27:14 main kernel: [153360.573499] nouveau 0000:01:00.0: gr: PGRAPH TLB flush idle timeout fail
Jul 24 14:27:14 main kernel: [153360.573504] nouveau 0000:01:00.0: gr: PGRAPH_STATUS 01b00403 [BUSY DISPATCH CCACHE_PREGEOM TPC_PROP TPC_TEX TPC_MP ROP]
Jul 24 14:27:14 main kernel: [153360.573507] nouveau 0000:01:00.0: gr: PGRAPH_VSTATUS0: 00000008 [CCACHE]
Jul 24 14:27:14 main kernel: [153360.573509] nouveau 0000:01:00.0: gr: PGRAPH_VSTATUS1: 00001068 [TPC_TEX TPC_MP]
Jul 24 14:27:14 main kernel: [153360.573511] nouveau 0000:01:00.0: gr: PGRAPH_VSTATUS2: 00200000 [ROP]
ul 24 14:27:16 main kernel: [153362.573754] nouveau 0000:01:00.0: gr: TRAP_MP_EXEC - TP 0 MP 0: 00000008 [TIMEOUT] at 07dd34 warp 29, opcode c0040000 c0050204
Jul 24 14:27:16 main kernel: [153362.573761] nouveau 0000:01:00.0: gr: TRAP_MP_EXEC - TP 0 MP 1: 00000008 [TIMEOUT] at 07dd34 warp 31, opcode c0040000 c0050204
Jul 24 14:27:16 main kernel: [153362.573763] nouveau 0000:01:00.0: gr: 00200000 [] ch 3 [001fa14000 Xorg[8392]] subc 3 class 8597 mthd 108c data 002affff

и потом "многоточие"
..............................................................................................................................................................................................
..............................................................................................................................................................................................


Несколько раз находил в сети предположение, что проблема может быть с видеокартой. И вот в логах есть ссылка на nouveau. Установлен проприетарный драйвер.

Кто-то может прокомментировать?
  • Вопрос задан
  • 321 просмотр
Пригласить эксперта
Ответы на вопрос 4
martin74ua
@martin74ua Куратор тега Linux
Linux administrator
так проприетарный или nouveau?
вы определитесь
Ответ написан
ValdikSS
@ValdikSS
Вполне возможно, что причина зависаний в nouveau. Я недавно сталкивался с подобными зависаниями на 8600GT, причём система зависала полностью, словно процессор переставал выполнять код, будто драйвер вводит систему в бесконечное ожидание команд от PCI-шины, блокирующее процессор.

https://forums.debian.net/viewtopic.php?t=150559
Кому-то помогло отключение аппаратного курсора:
https://bbs.archlinux.org/viewtopic.php?id=254229

решил проверить syslog и увидел странное […] и потом "многоточие"
Скорее всего вы видите нуль-байты битого файла: размер файла успел увеличиться до зависание системы, а сами данные не успели записаться.

Решение: использовать проприетарный драйвер или сообщать об ошибке разработчикам nouveau и отлаживать с ними.
Ответ написан
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
Часто такое зависание в Linux происходит из-за утечки памяти и плохой работы менеджера памяти. Попробуйте использовать OOM-киллер, например nohang, для раннего обнаружения нехватки памяти.
Ответ написан
hint000
@hint000
у админа три руки
и потом "многоточие"
Не исключено, что за многоточием скрывается самое интересное. Т.е. что-то могло писаться в лог, но кэш не удалось сбросить на диск. В таком случае было бы здорово настроить вывод rsyslog по сети на другой линуксовый хост (параллельно с записью в локальный файл) - есть шанс, что в переданном логе сохранится больше интересного.

А ещё я бы погонял Memtest86 непрерывно проходов пять или больше.
А ещё в конфигах включите комбинации с клавишей SysRq и после очередного зависания проверьте, реагирует ли на магическую последовательность R E I S U B.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы