[linux] hardwarove problemy

Matej Kovac matej na pobox.sk
Úterý Září 7 02:11:57 CEST 1999


hi,

mam vazne hw problemy. po pridavani ramky mi zacal padat linux (rh60,
kernel 2.2.5-22). ramka je uz samozrejme povodna, pada mi to vsak stale.
existuje nieco na (naozaj dobru) kontrolu ram pod linuxom? skusal som
nastroje ako checkit (do 16mb...) a bimem sys z win95 aj z dos622 a tie
nenasli nic.

popis spravania systemu: kazdy druhy program hlasi segmentation fault,
core dumped - vratane iksov a jednotlivych programov po nimi -
jednoducho sa zavru vsetky okna netscape, licq, alebo tvrdo padne
window-maker. niekedy zahlasi ze ma signal 11 (segfault) a ze to moze
byt bug, niekedy sa nic nepyta. iksy casto zvyknu padnut aj tak, ze my
zmizne kurzor a objavi sa tam bitmapa asi 64x16 (sirka x vyska) znama z
televiznej obrazovky z programu vojna ciernych a bielych (mam 65k
faireb). iksy potom stvrdnu tak ze nefunguje ani ctl-alt-bs, ani
sysrq+magic keys, len cervene tlacitko na bednicke. na kozole pada napr.
pine, mc, ... ani raz som nevidel (dnes) spravu kernel panic, ale nieco
ako "unable to handle kernel null pointer at virtual address 0x00000000
(process pine).........+ obsahy registrov, stack dump, ..." je uplne
bezne. niekedy len prechadzaju adresy po obrazovke v takej frekvencii ze
videokarta nestiha zobrazovat cele znaky, z coho usudzujem ze je to
(pokus o nejaky) vypis spadnuteho kernelu na obrazovku a nie nejakeho
programu na terminal, co je pomalsie...

mam povodny hardware, filesystemy boli kontrolovane po kazdom (nie len
tvrdom) restarte a pri kazdom montovani je zapnuta volba strict (man 5
mount).

kernel bol kompilovany asi pred mesiacom a pol, je v poriadku.

druha vec co podozrievam je harddisk - ide, wdc34300. funkcia smart pise
pri kazdom boote:

S.M.A.R.T.: Primary Master disk StatusBAD. Backup and Replace.

kto sa trochu vyzna do hdd... je to az take zle? mam sa vazne strachovat
o moje data? je mozne ze to nie je ramkou, ale zlym hdd (myslim ze napr.
binarky sa nacitaju so zopar zmenenymi byte) ??

skusil som stiahnut z westernu utiliu na checkovanie diskov (najnovsia
tam je dlgt21.exe, co obsahuje byvaly wddiag.exe, premenovany, myslim ze
v4.0). vysledkom bolo pri zapnutom S.M.A.R.T. v biose je ze "disk
contains errors and is not repairable, contact wd tech support with the
following status code: 0207". to pisal este pred kontrolou disku a tymto
aj skoncil.

ked som vypol smart, zbehol extended read/verify test, avsak s
evidentnymi problemami pri citani z cylindrov 0...300 (cim blizsie ku
300 tym mu to slo lepsie). btw, disk je wdc ac34300, c/h/s 8896/15/63.
po prvom zbehnuti nezahlasil ziadne chyby aj napriek tymto problemom,
ale ako spravny zavislak som to nechal zbehnut este raz. teraz uz nasiel
par 'repairable' chyb. opravil som a pustil som to zas, co znovu
skoncilo repairovanim nejakych sektorov - teraz uz aj niektore presuval
do zaloznej oblasti. tu sa moje zavislacke pocinanie skoncilo a uz som
to nepustal este raz, je uz po druhej rano. momentalne som z toho disku
nabootovany, checkuje sa pri kazdom starte a /etc/fstab ma zapnutu
option strict pre kazdu particiu. nehlasi to ziadne chyby ani citanie z
disku z particie ktora lezi na prvych cylindroch nie je o nic pomalsie
ako z ostatnych particii.

najdolezitejsie data su vyzalohovane, ale bol by som velmi rad keby sa
mi podarilo vyriesit tieto problemy s ramkou a hdd, kedze ma pred
nedavnom opustil monitor (ja blbec som ho zapojil do windoze a tie tam
slahli taku frekvenciu ze ho to dorazilo... btw, bola tam slabsia karta
aku mam na linuxe, neviem si to vysvetlit...)

vopred dakujem za akukolvek pomoc.

Matej Kovac     | blgts: "software je jediny priemysel, kde
matej na pobox.sk  | moj brak kupia -- a zhrabnem aj za podporu."



Další informace o konferenci linux