Периодическая произвольная перезагрузка
Проверься memtest и cpuburn каким-нибудь, такая нестабильность должна на них вылезти.
Ну или может у вас там что-то типа reboot on panic стоит.
У меня такое происходило из-за глючной оперативки, причем memtest86+ на ней проходил всегда без ошибок.
Был и у меня такой случай, но это редкость. Почти всегда memtest память с ошибками находит.
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 57Вот этот параметр странный: он ненулевой, хотя обычно он бывает ненулевым, когда есть переназначенные сектора.
Я бы проверил память, но в первую очередь — проферил шлейф диска и визуально осмотрел контроллер диска — не сгорел ли. Еще помогает посмотреть на напряжения (через sensors)
У тебя редкость, а я с такой памятью 2 года жил =) А до этого комп тоже самопроизвольно ребутался, но уже из-за БП.
# make search name='memtest'
Port: memtest-4.0.8
Path: /usr/ports/sysutils/memtest
Info: Utility to test for faulty memory subsystem
Maint: question+closedsrc.org
B-deps:
R-deps:
WWW: http://pyropus.ca/software/memtester/
Port: memtest86-3.4
Path: /usr/ports/sysutils/memtest86
Info: Stand alone memory test for x86 architecture computers
Maint: FreeBSD.org
B-deps:
R-deps:
WWW: http://www.memtest86.com/
Какую именно из этих 2-х софтин надо поставить?
Так же я поставил cpuburn, запустил burnP6 после чего программа не отдавала управление и ничего не выводила на консоль. Я почитал README-файл, там было сказано "Monitor progress of cpuburn by `ps`. When finished, `kill` the burn*", я так понял под finished подразумевается то время когда top уже не говорит о жутком потреблении памяти программой и убил ее.
она вернула 130, это что значит?
Ну или может у вас там что-то типа reboot on panic стоит.Я не наблюдал никогда паники ядра во FreeBSD, но вроде не стоит (у меня по крайней мере на эту тему дефолтная конфа).
Я бы проверил память, но в первую очередь — проферил шлейф диска и визуально осмотрел контроллер диска — не сгорел ли.Визуально - не есть хорошо - комп удаленный. До него я дойду не раньше чем через неделю.
Еще помогает посмотреть на напряжения (через sensors)Это подробнее можно? В портах находится только это:
# make search name='sensors'
Port: sensors-applet-1.6.1_5
Path: /usr/ports/sysutils/sensors-applet
Info: A GNOME applet displaying hardware sensor values
Maint: FreeBSD.org
WWW: http://sensors-applet.sourceforge.net/
Stand alone значит, что он запускается вместо ОС.
cpuburn просто греет cpu в бесконечном цикле. Ну, скажем, пару часов будет достаточно (по процессу на каждой cpu)
Stand alone значит, что он запускается вместо ОС.эээ.... а это в свою очередь что значит, оно мне ядро выгрузит? Я с этим компом по ssh только общаюсь... желательно бы восстановить контроль над компом после любых действий.
cpuburn просто греет cpu в бесконечном цикле.а, так значит надо бы запустить мой скрипт по контролю температуры по крону.
Так что насчет memtest? Я смогу его запустить и остановить, сохранив контроль над компом по ssh?
Нет, он работает только с локально - клавиатура, монитор
Ясно. Значит проведу тест когда доберусь до физической консоли.
Оставить комментарий
dangerr
Периодически самопроизвольно комп уходит в ребут. Ранее приходилось при каждом таком событии идти к нему и нажимать много раз "y" на вопросы fsck. Потом сделал:echo 'fsck_y_enable="YES"' >> /etc/rc.conf
и теперь замечаю перезагрузки только по обнулению uptime.
Пробовал мониторить темературу проца по крону с помощью mbmon - никогда выше 45 не поднимается и перед перезагрузкой тоже невысокая.
Наверное основное подозрение на жеский диск... вот вывод smartctl, я не разбираюсь какие значения нормальны.... и еще меня смущает куча ошибок в конце...