Периодическая произвольная перезагрузка
В системном логе, видимо, тишина?
Проверься memtest и cpuburn каким-нибудь, такая нестабильность должна на них вылезти.
Ну или может у вас там что-то типа reboot on panic стоит.
Проверься memtest и cpuburn каким-нибудь, такая нестабильность должна на них вылезти.
Ну или может у вас там что-то типа reboot on panic стоит.
У меня такое происходило из-за глючной оперативки, причем memtest86+ на ней проходил всегда без ошибок.
Был и у меня такой случай, но это редкость. Почти всегда memtest память с ошибками находит.
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 57Вот этот параметр странный: он ненулевой, хотя обычно он бывает ненулевым, когда есть переназначенные сектора.
Я бы проверил память, но в первую очередь — проферил шлейф диска и визуально осмотрел контроллер диска — не сгорел ли. Еще помогает посмотреть на напряжения (через sensors)
У тебя редкость, а я с такой памятью 2 года жил =) А до этого комп тоже самопроизвольно ребутался, но уже из-за БП.
В логе тишина.
Какую именно из этих 2-х софтин надо поставить?
Так же я поставил cpuburn, запустил burnP6 после чего программа не отдавала управление и ничего не выводила на консоль. Я почитал README-файл, там было сказано "Monitor progress of cpuburn by `ps`. When finished, `kill` the burn*", я так понял под finished подразумевается то время когда top уже не говорит о жутком потреблении памяти программой и убил ее.
она вернула 130, это что значит?
# make search name='memtest'
Port: memtest-4.0.8
Path: /usr/ports/sysutils/memtest
Info: Utility to test for faulty memory subsystem
Maint: question+closedsrc.org
B-deps:
R-deps:
WWW: http://pyropus.ca/software/memtester/
Port: memtest86-3.4
Path: /usr/ports/sysutils/memtest86
Info: Stand alone memory test for x86 architecture computers
Maint: FreeBSD.org
B-deps:
R-deps:
WWW: http://www.memtest86.com/
Какую именно из этих 2-х софтин надо поставить?
Так же я поставил cpuburn, запустил burnP6 после чего программа не отдавала управление и ничего не выводила на консоль. Я почитал README-файл, там было сказано "Monitor progress of cpuburn by `ps`. When finished, `kill` the burn*", я так понял под finished подразумевается то время когда top уже не говорит о жутком потреблении памяти программой и убил ее.
она вернула 130, это что значит?
Ну или может у вас там что-то типа reboot on panic стоит.Я не наблюдал никогда паники ядра во FreeBSD, но вроде не стоит (у меня по крайней мере на эту тему дефолтная конфа).
Я бы проверил память, но в первую очередь — проферил шлейф диска и визуально осмотрел контроллер диска — не сгорел ли.Визуально - не есть хорошо - комп удаленный. До него я дойду не раньше чем через неделю.
Еще помогает посмотреть на напряжения (через sensors)Это подробнее можно? В портах находится только это:
# make search name='sensors'
Port: sensors-applet-1.6.1_5
Path: /usr/ports/sysutils/sensors-applet
Info: A GNOME applet displaying hardware sensor values
Maint: FreeBSD.org
WWW: http://sensors-applet.sourceforge.net/
memtest86 или memtest86+
Stand alone значит, что он запускается вместо ОС.
cpuburn просто греет cpu в бесконечном цикле. Ну, скажем, пару часов будет достаточно (по процессу на каждой cpu)
Stand alone значит, что он запускается вместо ОС.
cpuburn просто греет cpu в бесконечном цикле. Ну, скажем, пару часов будет достаточно (по процессу на каждой cpu)
Stand alone значит, что он запускается вместо ОС.эээ.... а это в свою очередь что значит, оно мне ядро выгрузит? Я с этим компом по ssh только общаюсь... желательно бы восстановить контроль над компом после любых действий.
cpuburn просто греет cpu в бесконечном цикле.а, так значит надо бы запустить мой скрипт по контролю температуры по крону.
При запущенном cpuburn проц по данным mbmon нагревается максимум до 52 градусов. Комп не перезагружался, хотя cpuburn работал несколько часов.
Так что насчет memtest? Я смогу его запустить и остановить, сохранив контроль над компом по ssh?
Так что насчет memtest? Я смогу его запустить и остановить, сохранив контроль над компом по ssh?
Нет, он работает только с локально - клавиатура, монитор
Ясно. Значит проведу тест когда доберусь до физической консоли.
Оставить комментарий
dangerr
Периодически самопроизвольно комп уходит в ребут. Ранее приходилось при каждом таком событии идти к нему и нажимать много раз "y" на вопросы fsck. Потом сделал:echo 'fsck_y_enable="YES"' >> /etc/rc.conf
и теперь замечаю перезагрузки только по обнулению uptime.
Пробовал мониторить темературу проца по крону с помощью mbmon - никогда выше 45 не поднимается и перед перезагрузкой тоже невысокая.
Наверное основное подозрение на жеский диск... вот вывод smartctl, я не разбираюсь какие значения нормальны.... и еще меня смущает куча ошибок в конце...