[linux] ,,divne'' tuhnutie masiny

Juraj Bednar juraj na bednar.sk
Pátek Říjen 18 13:06:32 CEST 2002


Ahojte,


   masina mi robi velmi podivuhodne veci. Po uptime 4.6 mesiaca mi
   z nicoho nic presla do dost zvlastneho modu. Load skocil na 49,
   nevedel som spustit dalsi shell (teda sa napr. lognut), ani v screene
   otvorit nove okno so shellom. Na druhej strane kernel ako taky bezal
   a uz beziace procesy (napriklad silc klient a irssi klient) mi bezali
   uplne v pohode. Prvykrat, ked sa to stalo, tak nejaky proces zaberal
   99% procesoroveho casu (v tomto pripade vimko). Pri dalsich pripadoch
   mal ale procesor 97% idle a aj napriek tomu bol load 14.9. Rozmyslal
   som, ci to nemoze byt diskami (ze by cakal na iowait). Zatial to
   nemam ani potvrdene, ani vyvratene, kazdopadne 
   dd if=/dev/hda of=/dev/null bs=16384
   preslo na obidvoch diskoch v pohode. Zaroven sa kazdu noc jeden disk
   rsyncuje na druhy a pocas tohto (podla mna pomerne velkeho
   stresstestu) sa do tohto stavu nikdy masina nedostala.

   Co sa tyka toho silcu a ircu, funguje tam prikaz /exec, cez ktory sa
   mi vlastne podarilo zistit load. Raz sa mi podarilo pustit top, teraz
   posledny krat (ked som nemal volny bash) som sa pokusal spustit ps
   aux, to nezbehlo. Na druhej strane prikazy uptime a vmstat zbehli v
   poriadku. Ludia, ktori mali ako shell /usr/bin/passwd sa mohli
   prihlasit a zmenit si heslo. Myslim, ze vmstat ani passwd nemali
   preco byt v cache, uptime bol v cache urcite, pretoze sa spusta
   (aspon mne) pri kazdom lognuti. Apache vacsinou tiez odpoveda, aj ked
   pomerne pomaly. Tam ale neviem povedat, co z toho, co tam mal, bolo
   nakesovane a co nie.

   No a posledna chrumkava vec -- masina az do rebootu vzdy v pohodicke
   logovala na lokalny disk do syslogu vsetky moje marne pokusy
   prihlasit sa (session opened for user root) a podobne a v logoch
   nebolo vobec nic nezvycajne, ako keby masine nic nebolo. Raz sa mi v
   takomto stave podarilo spustit reboot, na vsetkych konzolach som
   videl, ze ,,The system is going down for reboot NOW'', ale po
   tristvrte hodine to nejavilo ziadne znamky toho, ze by sa to chcelo
   rebootnut.

   Kernel fical v pohode a daval pomerne dobre ping replies, ako vzdy.

   Otazka je, co je zle -- moze pamat alebo disk sposobit taketo
   spravanie? Procak? Sietovka? Mam dost obmedzene moznosti testovania,
   lebo to cele debugujem remote a cez telefon, kazdopadne buduci tyzden
   tam budem moct byt aj fyzicky, tak sa na to pozriem. Co by to vobec
   mohlo sposobovat?

   System: Mandrake 8.2 so vsetkymi updatmi pre tu verziu, inac klasicka
   intelovska masina s jednou sietovkou, dvoma diskami a 128MB ram. 


      J.

-- 
Juraj Bednar             | Homepage at http://juraj.bednar.sk/     
computer journalist      | Store at http://www.geekstore.sk/        
system administrator     | PGP key: http://juraj.bednar.sk/pgp-key   
independent consultant   | Please stand for your freedom!            
------------- další část ---------------
Netextová příloha byla odstraněna...
Jméno: smime.p7s
Typ: application/x-pkcs7-signature
Velikost: 2061 bytes
Popis: [žádný popis není k dispozici]
Url : http://lists.linux.sk/pipermail/linux/attachments/20021018/7f33b903/attachment.bin 


Další informace o konferenci linux