[linux] Pravidelne zlyhania systemu

Peter Viskup skupko.sk na gmail.com
Pondělí Únor 27 09:16:41 CET 2012


On 02/13/2012 10:15 PM, Peter Viskup wrote:
> Zdravim vas vsetkych,
> vravi sa "viac hlav viac rozumu"...a ten moj uz nestaci. :-)
>
> Skontaktoval ma jeden znamy, ktory ma problem s jednym systemom. 
> Pravidelne kazdy pondelok v noci o 02:05 ostane server nedostupny.
>
> HW:
> ASUSTeK M4A88T-M
> BIOS 2303 (su novsie verzie, ale nemaju nic -co by sa mne zdalo- 
> relevantne v release notes)
> AMD Athlon(tm) II X4 640 Processor (3014MHz)
> 2x4GB RAM 1333 MHz
>
> OS:
> Debian Lenny 5.0.8
> Linux kernel 2.6.34.1 (nie z distribucnych repozitarov, bez podpory 
> nacitavania modulov)
>
> Symptomy:
>  - zlyhanie vzdy v pondelok o 02:05
>  - ziadna odpoved ani na ping
>  - na konzole bezia nejake vystupy - nemozne ich precitat, pretoze sa 
> obrazovka rychlo roluje
>  - medzi 02:05 a casom manualneho restartu ziadna syslog hlaska
>  - ziaden kernel oops ani ina kernel hlaska pred zlyhanim
>  - ziadna syslog hlaska ani na remote syslog serveri
>  - ziadne prekrocenia performance hranic viditelne zo sar reportov
>  - kazdy den o 02:00 sa spusta zalohovaci skript konfiguracie routerov 
> (ISPadmin)
>
> Bolo vymenene:
> 1) pamate (komplet)
> 2) stietovka (RTL8139 za Intel 1000<daco> Server) (odvtedy nebolo 
> detekovane zlyhanie - sietovka menena tento vikend)
>
> Bolo vykonane:
>  - este koncom minuleho roka server logoval oom-killer hlasky - 
> spraveny wrapper do cron-u, ktory nestartoval joby, pokial predosly 
> nestihol dobehnut - odvtedy ziadna podobna hlaska
>  - skonfigurovany remote syslog - ziadna hlaska v inkriminovanom case 
> nebola zalogovana
>  - kontrola SAR reportov - ziadne vynimocne vysoke hodnoty
>
> Mozne postupy:
>  - zmenit cas spustania zalohovacieho skriptu konfiguracie routerov 
> (ISPadmin)
>  - v pripade rolovania obrazovky zatlacit "Pause" klavesu a odfotit 
> vystup (snad by mohlo fungovat)
>  - skonfigurovanie/zapnutie akehokolvek rozsireneho logovania (navrhy 
> vitane)
>  - nejake dalsie?
>
> Privitam aj akekolvek podnety co a ako sledovat online v buduci 
> pondelok rano.
>
> S pozdravom,
> -- 
> Peter Viskup

Chcem sa podelit o nove info.
Po vymene zdroja to vyzera, ze dnesne rano bolo bez vypadku.

Este jedna z veci, ktora visi ako jedna z moznosti je, ze sme zrusili 
pravidelny restart routrov v prostredi, ktore v tom case su zalohovane 
akymsi skriptom z balika ISPadmin. Nemate nahodou niekto skusenosti s 
tymto balikom?

S pozdravom,
--
Peter Viskup


Další informace o konferenci linux