[linux] Pravidelne zlyhania systemu

Peter Viskup skupko.sk na gmail.com
Pondělí Únor 13 22:15:14 CET 2012


Zdravim vas vsetkych,
vravi sa "viac hlav viac rozumu"...a ten moj uz nestaci. :-)

Skontaktoval ma jeden znamy, ktory ma problem s jednym systemom. 
Pravidelne kazdy pondelok v noci o 02:05 ostane server nedostupny.

HW:
ASUSTeK M4A88T-M
BIOS 2303 (su novsie verzie, ale nemaju nic -co by sa mne zdalo- 
relevantne v release notes)
AMD Athlon(tm) II X4 640 Processor (3014MHz)
2x4GB RAM 1333 MHz

OS:
Debian Lenny 5.0.8
Linux kernel 2.6.34.1 (nie z distribucnych repozitarov, bez podpory 
nacitavania modulov)

Symptomy:
  - zlyhanie vzdy v pondelok o 02:05
  - ziadna odpoved ani na ping
  - na konzole bezia nejake vystupy - nemozne ich precitat, pretoze sa 
obrazovka rychlo roluje
  - medzi 02:05 a casom manualneho restartu ziadna syslog hlaska
  - ziaden kernel oops ani ina kernel hlaska pred zlyhanim
  - ziadna syslog hlaska ani na remote syslog serveri
  - ziadne prekrocenia performance hranic viditelne zo sar reportov
  - kazdy den o 02:00 sa spusta zalohovaci skript konfiguracie routerov 
(ISPadmin)

Bolo vymenene:
1) pamate (komplet)
2) stietovka (RTL8139 za Intel 1000<daco> Server) (odvtedy nebolo 
detekovane zlyhanie - sietovka menena tento vikend)

Bolo vykonane:
  - este koncom minuleho roka server logoval oom-killer hlasky - 
spraveny wrapper do cron-u, ktory nestartoval joby, pokial predosly 
nestihol dobehnut - odvtedy ziadna podobna hlaska
  - skonfigurovany remote syslog - ziadna hlaska v inkriminovanom case 
nebola zalogovana
  - kontrola SAR reportov - ziadne vynimocne vysoke hodnoty

Mozne postupy:
  - zmenit cas spustania zalohovacieho skriptu konfiguracie routerov 
(ISPadmin)
  - v pripade rolovania obrazovky zatlacit "Pause" klavesu a odfotit 
vystup (snad by mohlo fungovat)
  - skonfigurovanie/zapnutie akehokolvek rozsireneho logovania (navrhy 
vitane)
  - nejake dalsie?

Privitam aj akekolvek podnety co a ako sledovat online v buduci pondelok 
rano.

S pozdravom,
--
Peter Viskup


Další informace o konferenci linux