[linux] Pravidelne zlyhania systemu

riki phobie na axfr.org
Úterý Únor 14 00:20:56 CET 2012


echo 0 > /proc/sys/kernel/hung_task_timeout_secs ale to by si videl v
nejakom logu.

Skus *.* zo syslogu logovat do /var/log/all nech mas istotu ze hladas
dobre a korelujes.

Ked rebootnes v stredu rucne, znova sa zasekne v nedelu alebo o tyzden? :)

r.

On 2/14/12 12:07 AM, riki wrote:
> Pozri cron.weekly joby, nastav cas o 3 hodiny naspat a pozeraj kedy to
> vytuhne :).
> 
> Ked ti nic nezapise do logov, zasekne sa vacsinou procesor, neviem si
> vysvetlit co loguje na konzolu ale bude to predtym ako to naozaj vytuhne.
> 
> Ako sa ma upska?
> 
> r.
> 
> On 2/13/12 10:15 PM, Peter Viskup wrote:
>> Zdravim vas vsetkych,
>> vravi sa "viac hlav viac rozumu"...a ten moj uz nestaci. :-)
>>
>> Skontaktoval ma jeden znamy, ktory ma problem s jednym systemom.
>> Pravidelne kazdy pondelok v noci o 02:05 ostane server nedostupny.
>>
>> HW:
>> ASUSTeK M4A88T-M
>> BIOS 2303 (su novsie verzie, ale nemaju nic -co by sa mne zdalo-
>> relevantne v release notes)
>> AMD Athlon(tm) II X4 640 Processor (3014MHz)
>> 2x4GB RAM 1333 MHz
>>
>> OS:
>> Debian Lenny 5.0.8
>> Linux kernel 2.6.34.1 (nie z distribucnych repozitarov, bez podpory
>> nacitavania modulov)
>>
>> Symptomy:
>>  - zlyhanie vzdy v pondelok o 02:05
>>  - ziadna odpoved ani na ping
>>  - na konzole bezia nejake vystupy - nemozne ich precitat, pretoze sa
>> obrazovka rychlo roluje
>>  - medzi 02:05 a casom manualneho restartu ziadna syslog hlaska
>>  - ziaden kernel oops ani ina kernel hlaska pred zlyhanim
>>  - ziadna syslog hlaska ani na remote syslog serveri
>>  - ziadne prekrocenia performance hranic viditelne zo sar reportov
>>  - kazdy den o 02:00 sa spusta zalohovaci skript konfiguracie routerov
>> (ISPadmin)
>>
>> Bolo vymenene:
>> 1) pamate (komplet)
>> 2) stietovka (RTL8139 za Intel 1000<daco> Server) (odvtedy nebolo
>> detekovane zlyhanie - sietovka menena tento vikend)
>>
>> Bolo vykonane:
>>  - este koncom minuleho roka server logoval oom-killer hlasky - spraveny
>> wrapper do cron-u, ktory nestartoval joby, pokial predosly nestihol
>> dobehnut - odvtedy ziadna podobna hlaska
>>  - skonfigurovany remote syslog - ziadna hlaska v inkriminovanom case
>> nebola zalogovana
>>  - kontrola SAR reportov - ziadne vynimocne vysoke hodnoty
>>
>> Mozne postupy:
>>  - zmenit cas spustania zalohovacieho skriptu konfiguracie routerov
>> (ISPadmin)
>>  - v pripade rolovania obrazovky zatlacit "Pause" klavesu a odfotit
>> vystup (snad by mohlo fungovat)
>>  - skonfigurovanie/zapnutie akehokolvek rozsireneho logovania (navrhy
>> vitane)
>>  - nejake dalsie?
>>
>> Privitam aj akekolvek podnety co a ako sledovat online v buduci pondelok
>> rano.
>>
>> S pozdravom,
>> -- 
>> Peter Viskup
>> _______________________________________________
>> https://lists.linux.sk/mailman/listinfo/linux
>> Meta FAQ: http://www.sklug.sk/lists/linux/metafaq.html
> _______________________________________________
> https://lists.linux.sk/mailman/listinfo/linux
> Meta FAQ: http://www.sklug.sk/lists/linux/metafaq.html


Další informace o konferenci linux