debian сервер выдает ошибки

Teteshnik

вобщем что-то происходит.
теряется связь с сервером.
на экране я вижу это

подскажите плиз либо что это, может кто такое уже видел, либо в каких логах это смотреть подробней?

vall

oops как oops, какое ядро то?

Teteshnik

только обновил до 2.6.26-2-686
полгода наверно не обновлял, но проблема как-то резко появилась после штатной долгой работы.
в инете говорят что вроде ядро глючит. нужно обновиться.
вобщем. там говорят посмотрите по команде dmesg ошибки. чего я там не должен увидеть? ато букав много, не понимаю ничего.

vall

ну если тебе это что-то объяснит то это oops, aka kernel panic. по тому что влезло на экран точно могу сказать что не BUG_ON, так что наверняка page-fault, а т.к. он приключился в slab-аллокаторе то баг может быть наведён откуда угодно.
А раз ядро довольно древнее и даже не последнее из дебиановских то дальше копать будет смысл если увидишь это опять.

Teteshnik

ok, пасиба.

Teteshnik

зоебись, теперь банановый

Teteshnik

короче толи это rtorrent + rutorrent, толи с ними связанное. они стартуют, качают, потом вот это.

tokuchu

короче толи это rtorrent + rutorrent, толи с ними связанное. они стартуют, качают, потом вот это.
Ну так они просто вскрывают проблему, а это, возможно, может быть: память, перегрев проца, чипсета, хз ещё что.

Teteshnik

не знал что новая версия вышла. обновляться надо.

jgimi

Почитай разные лог-файлы, проанализируй.
У гугла спроси.

Teteshnik

ну вот кстати, какие логи перво наперво смотреть надо?
просто то что я смотрел, там ничего криминального не было. т.е. я просто не знаю где нужно искать потому как никогда надобности не возникало.

serega1604

/var/log/{syslog,dmesg,kern.log}

jgimi

Все, что в каталоге /var/log/
За одно /var/mail/* и /var/spool/mail/*, может и там что интересное найдешь.
Некоторые приложения письма руту отправляют, когда им хреново становится.

vall

да какой перегрев, это банальный баг в ядре. в логах искать нечего — когда он наступает туда писать уже некому.

vall

попробуй добавить в kernel cmdline slub_debug=FZPU возможно у тебя есть динамический slab debug тогда возможно что-нить будет понятнее.

jgimi

попробуй добавить в kernel cmdline slub_debug=FZPU
Может сначала логи стоит почитать, а уж потом только пытаться дебажить?
Хотя для неспециалиста и не для ядерного писателя дебаг вряд ли будет чем-то полезен, проще сразу обновиться или переустановить систему.

Filan

да какой перегрев, это банальный баг в ядре.
Мсье обладает даром ясновиденья?
Если можно откатиться или обновиться - да попробовать стоит. Но если после этого "паника" всё равно будет появляться, то смотреть на железо.
Прогнать memtest. Потом mhdd. LinX (не знаю аналогов для линухов). Подключить другой БП. И всё время смотреть на датчики - хотя бы те, которые lm-sensors отдетектил.

vall

да, тебе наверно виднее. это же флокал, тут каждый специалист во всём.

jgimi

В споре рождается истина (с)

vall

тут в споре обычно палятся боты

vall

Мсье обладает даром ясновиденья?
и месье получает за это зарплату

tokuchu

да какой перегрев, это банальный баг в ядре. в логах искать нечего — когда он наступает туда писать уже некому.
Т.е. при аппаратных глюках таких ошибок быть не может?

vall

такое бывает крайне редко, и уж точно не два раза подряд в одной функции.
это такая стандартная отмазка когда не хочется разбираться в проблеме — послать проверять железо, половина больше не возвращаются, остальные приходят через несколько дней, и меньше чем в одном проценте случаев действительно находят проблемы с железом. но бывает всякое, пару раз даже находили то что упоминалось в errata на процессоры.

Filan

такое бывает крайне редко
Кернел паник при проблемах с железом?
Сколько читаю русскоязычную рассылку freebsd - процентов 80 паник из-за железа, при чём большинство из-за памяти. Далее идут диски, забитые пылью радиаторы, подсевшие или некачественные БП, мамы, прочие карточки, а ошибки в самой системе/драйверах по частоте где-то около мам и прочих карточек.

tokuchu

такое бывает крайне редко, и уж точно не два раза подряд в одной функции.
Ну я просто плохо разбираюсь и не особо заметил, что функция одна. :)

hoha32

вынутые неотмонтированные флешки и дискеты продолжают упоминаться?

Filan

вынутые неотмонтированные флешки и дискеты продолжают упоминаться?
Никогда таким не страдал. Даже на мастдае флешки вынимал всегда только "безопасно".

hoha32

Никогда таким не страдал. Даже на мастдае флешки вынимал всегда только "безопасно".
Какой ты правильный.
Может, пострадаешь разок? Чисто из спортивного интереса.

Filan

Какой ты правильный.
Не люблю создавать себе проблемы, чтобы потом героически их решать.
Может, пострадаешь разок? Чисто из спортивного интереса.
А смысл? Хочешь экспериментировать - воспользуйся своей фрёй.

hoha32

Хочешь экспериментировать - воспользуйся своей фрёй.
Если бы была под рукой конечно же поставил бы эксперимент. В линухе и тем более венде уже ставил.

Filan

Видел я эффекты с поломаной FS на флешке после неправильного вынимания а мастдае. Нах мне такое счастье?

hoha32

Видел я эффекты с поломаной FS
Я как-то не видел, так что мне пофиг. Там же некэшируемая запись. Перестала мигать лампочка - можно вынимать.
Зато kernel panic от вынимания неразмонтрованной флешки в БСД точно видел =) Давно правда, вот и интересно как там щас дела.

sergey_m

Вечно ты любую тему к этому вопросу сводишь. Если правда интересно, то поставь и проверь.

hoha32

Вечно ты любую тему к этому вопросу сводишь.
Я знаю что у тебя хорошая память. Напомни мне, пожалуйста, когда я в последний раз сводил тему "к этому вопросу". Неплохо было бы ещё прояснить что же это за вопрос такой - но, впрочем, не обязательно.
"поставь, проверь"... А форум мне на что? Спросить явно быстрее чем провернуть эти действия.
В любом случае, на работе нашёлся компороутер со сравнительно свежей БСД, по случайному стечению обстоятельств мною же и поставленный. 7.4 на такие манипуляции чхать хотела. Флешка тоже.
Оставить комментарий
Имя или ник:
Комментарий: