[linux] Pravidelne zlyhania systemu
Peter Viskup
skupko.sk na gmail.com
Pondělí Únor 27 09:16:41 CET 2012
On 02/13/2012 10:15 PM, Peter Viskup wrote:
> Zdravim vas vsetkych,
> vravi sa "viac hlav viac rozumu"...a ten moj uz nestaci. :-)
>
> Skontaktoval ma jeden znamy, ktory ma problem s jednym systemom.
> Pravidelne kazdy pondelok v noci o 02:05 ostane server nedostupny.
>
> HW:
> ASUSTeK M4A88T-M
> BIOS 2303 (su novsie verzie, ale nemaju nic -co by sa mne zdalo-
> relevantne v release notes)
> AMD Athlon(tm) II X4 640 Processor (3014MHz)
> 2x4GB RAM 1333 MHz
>
> OS:
> Debian Lenny 5.0.8
> Linux kernel 2.6.34.1 (nie z distribucnych repozitarov, bez podpory
> nacitavania modulov)
>
> Symptomy:
> - zlyhanie vzdy v pondelok o 02:05
> - ziadna odpoved ani na ping
> - na konzole bezia nejake vystupy - nemozne ich precitat, pretoze sa
> obrazovka rychlo roluje
> - medzi 02:05 a casom manualneho restartu ziadna syslog hlaska
> - ziaden kernel oops ani ina kernel hlaska pred zlyhanim
> - ziadna syslog hlaska ani na remote syslog serveri
> - ziadne prekrocenia performance hranic viditelne zo sar reportov
> - kazdy den o 02:00 sa spusta zalohovaci skript konfiguracie routerov
> (ISPadmin)
>
> Bolo vymenene:
> 1) pamate (komplet)
> 2) stietovka (RTL8139 za Intel 1000<daco> Server) (odvtedy nebolo
> detekovane zlyhanie - sietovka menena tento vikend)
>
> Bolo vykonane:
> - este koncom minuleho roka server logoval oom-killer hlasky -
> spraveny wrapper do cron-u, ktory nestartoval joby, pokial predosly
> nestihol dobehnut - odvtedy ziadna podobna hlaska
> - skonfigurovany remote syslog - ziadna hlaska v inkriminovanom case
> nebola zalogovana
> - kontrola SAR reportov - ziadne vynimocne vysoke hodnoty
>
> Mozne postupy:
> - zmenit cas spustania zalohovacieho skriptu konfiguracie routerov
> (ISPadmin)
> - v pripade rolovania obrazovky zatlacit "Pause" klavesu a odfotit
> vystup (snad by mohlo fungovat)
> - skonfigurovanie/zapnutie akehokolvek rozsireneho logovania (navrhy
> vitane)
> - nejake dalsie?
>
> Privitam aj akekolvek podnety co a ako sledovat online v buduci
> pondelok rano.
>
> S pozdravom,
> --
> Peter Viskup
Chcem sa podelit o nove info.
Po vymene zdroja to vyzera, ze dnesne rano bolo bez vypadku.
Este jedna z veci, ktora visi ako jedna z moznosti je, ze sme zrusili
pravidelny restart routrov v prostredi, ktore v tom case su zalohovane
akymsi skriptom z balika ISPadmin. Nemate nahodou niekto skusenosti s
tymto balikom?
S pozdravom,
--
Peter Viskup
Další informace o konferenci linux