[linux] Pravidelne zlyhania systemu
Peter Viskup
skupko.sk na gmail.com
Pondělí Únor 13 22:15:14 CET 2012
Zdravim vas vsetkych,
vravi sa "viac hlav viac rozumu"...a ten moj uz nestaci. :-)
Skontaktoval ma jeden znamy, ktory ma problem s jednym systemom.
Pravidelne kazdy pondelok v noci o 02:05 ostane server nedostupny.
HW:
ASUSTeK M4A88T-M
BIOS 2303 (su novsie verzie, ale nemaju nic -co by sa mne zdalo-
relevantne v release notes)
AMD Athlon(tm) II X4 640 Processor (3014MHz)
2x4GB RAM 1333 MHz
OS:
Debian Lenny 5.0.8
Linux kernel 2.6.34.1 (nie z distribucnych repozitarov, bez podpory
nacitavania modulov)
Symptomy:
- zlyhanie vzdy v pondelok o 02:05
- ziadna odpoved ani na ping
- na konzole bezia nejake vystupy - nemozne ich precitat, pretoze sa
obrazovka rychlo roluje
- medzi 02:05 a casom manualneho restartu ziadna syslog hlaska
- ziaden kernel oops ani ina kernel hlaska pred zlyhanim
- ziadna syslog hlaska ani na remote syslog serveri
- ziadne prekrocenia performance hranic viditelne zo sar reportov
- kazdy den o 02:00 sa spusta zalohovaci skript konfiguracie routerov
(ISPadmin)
Bolo vymenene:
1) pamate (komplet)
2) stietovka (RTL8139 za Intel 1000<daco> Server) (odvtedy nebolo
detekovane zlyhanie - sietovka menena tento vikend)
Bolo vykonane:
- este koncom minuleho roka server logoval oom-killer hlasky -
spraveny wrapper do cron-u, ktory nestartoval joby, pokial predosly
nestihol dobehnut - odvtedy ziadna podobna hlaska
- skonfigurovany remote syslog - ziadna hlaska v inkriminovanom case
nebola zalogovana
- kontrola SAR reportov - ziadne vynimocne vysoke hodnoty
Mozne postupy:
- zmenit cas spustania zalohovacieho skriptu konfiguracie routerov
(ISPadmin)
- v pripade rolovania obrazovky zatlacit "Pause" klavesu a odfotit
vystup (snad by mohlo fungovat)
- skonfigurovanie/zapnutie akehokolvek rozsireneho logovania (navrhy
vitane)
- nejake dalsie?
Privitam aj akekolvek podnety co a ako sledovat online v buduci pondelok
rano.
S pozdravom,
--
Peter Viskup
Další informace o konferenci linux