[linux] ,,divne'' tuhnutie masiny
Ivan Malich
malich na decef.elf.stuba.sk
Pátek Říjen 18 17:14:23 CEST 2002
> Ahojte,
Cau
Nieco podobne sa mi stalo pred tyzdnom, ale na HP-UXe. A nebolo to az
take vazne. Spravalo sa to tak, ze zhruba kazdych 20 - 60 sekund asi
na 5 - 20 sekund sekund stuhol (robil som v shelli) a proste nic nerobil,
vyzeralo to skoro tak, ako keby bol problem so sietou (ze na tych 5 - 20
sekund mi proste odtial neprisli pakety). V tej chvilke, ked to zrovna
islo, to malo uplne pohodovu odozvu (teda ten shell), mohol som spustat
programy, ibaze mali problem s prekreslovanim obrazovky (napr. top).
Odozva na ping bola v pohode.
Sposobene to bolo jednym agentom, ktory bezal na tom stroji. Zle sme ho
nakonfigurovali. Mal v nejakych pravidelnych intervaloch skenovat nejake
logy spustenim externeho prikazu. No a spustenie toho prikazu bolo dost
narocne na cas (a on necakal na skoncenie predosleho a rovno spustil
dalsi). Po nejakej hodine ten stroj bol nepouzitelny. Tak sme vypli
agenta, nastavili ho trosku inteligentnejsie a odvtedy sa problem
neukazal.
Ico
> masina mi robi velmi podivuhodne veci. Po uptime 4.6 mesiaca mi
> z nicoho nic presla do dost zvlastneho modu. Load skocil na 49,
> nevedel som spustit dalsi shell (teda sa napr. lognut), ani v screene
> otvorit nove okno so shellom. Na druhej strane kernel ako taky bezal
> a uz beziace procesy (napriklad silc klient a irssi klient) mi bezali
> uplne v pohode. Prvykrat, ked sa to stalo, tak nejaky proces zaberal
> 99% procesoroveho casu (v tomto pripade vimko). Pri dalsich pripadoch
> mal ale procesor 97% idle a aj napriek tomu bol load 14.9. Rozmyslal
> som, ci to nemoze byt diskami (ze by cakal na iowait). Zatial to
> nemam ani potvrdene, ani vyvratene, kazdopadne
> dd if=/dev/hda of=/dev/null bs=16384
> preslo na obidvoch diskoch v pohode. Zaroven sa kazdu noc jeden disk
> rsyncuje na druhy a pocas tohto (podla mna pomerne velkeho
> stresstestu) sa do tohto stavu nikdy masina nedostala.
>
> Co sa tyka toho silcu a ircu, funguje tam prikaz /exec, cez ktory sa
> mi vlastne podarilo zistit load. Raz sa mi podarilo pustit top, teraz
> posledny krat (ked som nemal volny bash) som sa pokusal spustit ps
> aux, to nezbehlo. Na druhej strane prikazy uptime a vmstat zbehli v
> poriadku. Ludia, ktori mali ako shell /usr/bin/passwd sa mohli
> prihlasit a zmenit si heslo. Myslim, ze vmstat ani passwd nemali
> preco byt v cache, uptime bol v cache urcite, pretoze sa spusta
> (aspon mne) pri kazdom lognuti. Apache vacsinou tiez odpoveda, aj ked
> pomerne pomaly. Tam ale neviem povedat, co z toho, co tam mal, bolo
> nakesovane a co nie.
>
> No a posledna chrumkava vec -- masina az do rebootu vzdy v pohodicke
> logovala na lokalny disk do syslogu vsetky moje marne pokusy
> prihlasit sa (session opened for user root) a podobne a v logoch
> nebolo vobec nic nezvycajne, ako keby masine nic nebolo. Raz sa mi v
> takomto stave podarilo spustit reboot, na vsetkych konzolach som
> videl, ze ,,The system is going down for reboot NOW'', ale po
> tristvrte hodine to nejavilo ziadne znamky toho, ze by sa to chcelo
> rebootnut.
>
> Kernel fical v pohode a daval pomerne dobre ping replies, ako vzdy.
>
> Otazka je, co je zle -- moze pamat alebo disk sposobit taketo
> spravanie? Procak? Sietovka? Mam dost obmedzene moznosti testovania,
> lebo to cele debugujem remote a cez telefon, kazdopadne buduci tyzden
> tam budem moct byt aj fyzicky, tak sa na to pozriem. Co by to vobec
> mohlo sposobovat?
>
> System: Mandrake 8.2 so vsetkymi updatmi pre tu verziu, inac klasicka
> intelovska masina s jednou sietovkou, dvoma diskami a 128MB ram.
>
>
> J.
>
> --
> Juraj Bednar | Homepage at http://juraj.bednar.sk/
> computer journalist | Store at http://www.geekstore.sk/
> system administrator | PGP key: http://juraj.bednar.sk/pgp-key
> independent consultant | Please stand for your freedom!
--
Ico <ico na podvodnik.cz> <malich na decef.elf.stuba.sk>
UNIX is user friendly. It's just selective about who its friends are.
Why use Windows, since there's a door???
Další informace o konferenci linux