[FreeBSD ] виснет
так что не пингуется и не реагирует на консольНастроить сериальную консоль. Собрать ядро с KDB, DDB, BREAK_TO_DEBUGGER. Когда повиснес, послать break на консоль и если она выйдет в дебаггер, то посмотреть в каком процессе крутится.
еще 3 таких тачки - на 1 стоит 5.3-STABLE,И все 4 абсолютно одинаковы?
на другой 5.3-BETA6 - работают стабильно, на третьей стоит linux 2.4 - тоже виснет.
то есть сервер работает 20-30 дней потом происходит 1-10 зависаний в течение 1-3 дней и дальше опять все стабильно.Если на предыдущий вопрос ответ - да, то может быть дело в температурном режиме?
Поставить 5.4-RELEASE (в нём новая версия twa от производителя если на нём воспроизводится, то написать в FreeBSD.org.
не могу ручаться что абсолютно одинаковые, но с большой вероятностью мать,рэйд контроллер одинаковые - тк собирал их один и тот же человек в одно время. точно сказать не могу тк остальные машинки вне пределов моей "досягаемости"
И все 4 абсолютно одинаковы?
температурный режим тут точно ни при чем, тк все машины стоят в стойках в серверных с кондеями
температура выше 17 не поднимается.
датчик внутри сервера стабильно показывает 23
попробую конечно подняться до 5.4
но twa - драйвер это для Escalade 9500 (такой у нас кстати тоже есть там стоит 5.3 - все гладко)
а в данном случае идет речь о драйвере twe
спасибо за совет про ddb
попробую разобраться - никогда еще ядро не дебужил.
Если конфигурации похожие, и все матеря из плохой партии, например.
Действительно, twe а не twa. Тогда апгрейдиться не имеет большого смысла, т.к. драйвер тот же.
Оставить комментарий
squeeze
стоит машинка - 2xXeon, 4Gb RAM, RAID - 3Ware Escalade 7500-12и переодически виснет по не понятным причинам.
иногда виснет полностью- так что не пингуется и не реагирует на консоль. а чаще продолжают работать процессы не обращающиеся к дисковой подсистеме. Тоесть пинги продлолжают ходить, если открыта была ssh или локальная сессия она продолжает работать, и можно давать любые не обращающиеся к диску команды. В один из таких случаев я выяснил что процессы все находятся в disk-wait состоянии (state D - комады ps)
и vmstat показывала 140 процессов в blocked for resources.
Есть подозрение что баг в драйвере twe (или в контроллере но что интересно полтора года этот сервер работал без проблем. Зависоны начались где-то в районе апгрейда фри до 5.3 - точно сказать не могу что произошло раньше, но есть еще 3 таких тачки - на 1 стоит 5.3-STABLE,
на другой 5.3-BETA6 - работают стабильно, на третьей стоит linux 2.4 - тоже виснет.
Искуственно создаваемая нагрузка на дисковую подсистему обычно не дает никаких результатов.
основной сервис предоставляемый сервером - samba - фалопомойка на 1.8 Tb.
причем зависоны обычно происходят "пачками" - то есть сервер работает 20-30 дней потом происходит 1-10 зависаний в течение 1-3 дней и дальше опять все стабильно.
Фря - 5.3 -RELEASE-p2
мб кто подскажет как траблшутить такие проблемы ? как локализовать баг ?