[linux] ,,divne'' tuhnutie masiny

Ivan Malich malich na decef.elf.stuba.sk
Pátek Říjen 18 17:14:23 CEST 2002


> Ahojte,

Cau

Nieco podobne sa mi stalo pred tyzdnom, ale na HP-UXe. A nebolo to az
take vazne. Spravalo sa to tak, ze zhruba kazdych 20 - 60 sekund asi
na 5 - 20 sekund sekund stuhol (robil som v shelli) a proste nic nerobil,
vyzeralo to skoro tak, ako keby bol problem so sietou (ze na tych 5 - 20
sekund mi proste odtial neprisli pakety). V tej chvilke, ked to zrovna
islo, to malo uplne pohodovu odozvu (teda ten shell), mohol som spustat
programy, ibaze mali problem s prekreslovanim obrazovky (napr. top).
Odozva na ping bola v pohode.

Sposobene to bolo jednym agentom, ktory bezal na tom stroji. Zle sme ho
nakonfigurovali. Mal v nejakych pravidelnych intervaloch skenovat nejake
logy spustenim externeho prikazu. No a spustenie toho prikazu bolo dost
narocne na cas (a on necakal na skoncenie predosleho a rovno spustil
dalsi). Po nejakej hodine ten stroj bol nepouzitelny. Tak sme vypli
agenta, nastavili ho trosku inteligentnejsie a odvtedy sa problem
neukazal.

Ico

>    masina mi robi velmi podivuhodne veci. Po uptime 4.6 mesiaca mi
>    z nicoho nic presla do dost zvlastneho modu. Load skocil na 49,
>    nevedel som spustit dalsi shell (teda sa napr. lognut), ani v screene
>    otvorit nove okno so shellom. Na druhej strane kernel ako taky bezal
>    a uz beziace procesy (napriklad silc klient a irssi klient) mi bezali
>    uplne v pohode. Prvykrat, ked sa to stalo, tak nejaky proces zaberal
>    99% procesoroveho casu (v tomto pripade vimko). Pri dalsich pripadoch
>    mal ale procesor 97% idle a aj napriek tomu bol load 14.9. Rozmyslal
>    som, ci to nemoze byt diskami (ze by cakal na iowait). Zatial to
>    nemam ani potvrdene, ani vyvratene, kazdopadne 
>    dd if=/dev/hda of=/dev/null bs=16384
>    preslo na obidvoch diskoch v pohode. Zaroven sa kazdu noc jeden disk
>    rsyncuje na druhy a pocas tohto (podla mna pomerne velkeho
>    stresstestu) sa do tohto stavu nikdy masina nedostala.
> 
>    Co sa tyka toho silcu a ircu, funguje tam prikaz /exec, cez ktory sa
>    mi vlastne podarilo zistit load. Raz sa mi podarilo pustit top, teraz
>    posledny krat (ked som nemal volny bash) som sa pokusal spustit ps
>    aux, to nezbehlo. Na druhej strane prikazy uptime a vmstat zbehli v
>    poriadku. Ludia, ktori mali ako shell /usr/bin/passwd sa mohli
>    prihlasit a zmenit si heslo. Myslim, ze vmstat ani passwd nemali
>    preco byt v cache, uptime bol v cache urcite, pretoze sa spusta
>    (aspon mne) pri kazdom lognuti. Apache vacsinou tiez odpoveda, aj ked
>    pomerne pomaly. Tam ale neviem povedat, co z toho, co tam mal, bolo
>    nakesovane a co nie.
> 
>    No a posledna chrumkava vec -- masina az do rebootu vzdy v pohodicke
>    logovala na lokalny disk do syslogu vsetky moje marne pokusy
>    prihlasit sa (session opened for user root) a podobne a v logoch
>    nebolo vobec nic nezvycajne, ako keby masine nic nebolo. Raz sa mi v
>    takomto stave podarilo spustit reboot, na vsetkych konzolach som
>    videl, ze ,,The system is going down for reboot NOW'', ale po
>    tristvrte hodine to nejavilo ziadne znamky toho, ze by sa to chcelo
>    rebootnut.
> 
>    Kernel fical v pohode a daval pomerne dobre ping replies, ako vzdy.
> 
>    Otazka je, co je zle -- moze pamat alebo disk sposobit taketo
>    spravanie? Procak? Sietovka? Mam dost obmedzene moznosti testovania,
>    lebo to cele debugujem remote a cez telefon, kazdopadne buduci tyzden
>    tam budem moct byt aj fyzicky, tak sa na to pozriem. Co by to vobec
>    mohlo sposobovat?
> 
>    System: Mandrake 8.2 so vsetkymi updatmi pre tu verziu, inac klasicka
>    intelovska masina s jednou sietovkou, dvoma diskami a 128MB ram. 
> 
> 
>       J.
> 
> -- 
> Juraj Bednar             | Homepage at http://juraj.bednar.sk/     
> computer journalist      | Store at http://www.geekstore.sk/        
> system administrator     | PGP key: http://juraj.bednar.sk/pgp-key   
> independent consultant   | Please stand for your freedom!            


--
Ico <ico na podvodnik.cz> <malich na decef.elf.stuba.sk>
UNIX is user friendly. It's just selective about who its friends are.
Why use Windows, since there's a door???




Další informace o konferenci linux