[linux] Problem s pamatou pri novom kerneli

Marek Podmaka marki na marki-online.net
Čtvrtek Červen 25 10:16:03 CEST 2009


Cau,

Wednesday, June 24, 2009, 17:54:27, Lubomir Host wrote:

> ak ti server "z nicoho nic" padal kazdych 10 dni, tak by to mohla byt
> chybna ramka. Co pise dmesg pri takom pade?

No on nepadal z nicoho nic. Zacal padat po reinstalacii na debian
lenny, predtym isiel par rokov bez problemov. Server proste
zahangoval, obcas nejaky proces nieco napisal do syslogu, ale nedalo
sa ani prihlasit. Zacalo to vzdy nejakym dumpom stacku kernelu, boli
tam aj nejake funkcie ohladne xfs a swapu.

S tymto novym kernelom sa mi to este nestalo.

> Skus pouzit memtest a otestovat ramku v tom serveri (idealne v rovnakej
> konfiguracii, ako ju mas zalozenu teraz). Cize bootnut z nejakeho CD
> a spustit memtest86.

Je to HP Proliant server s ECC RAM, takze blbosti by to robit nemalo.
Single bit error by to malo opravit a double bit error by mal sposobit
bud vytuhnutie alebo rovno reboot.

Ale vyzera to, ze uz som to vyriesil. Este raz som pozrel rozdiel
medzi mojim a debian kernelom a skusil som zapnut podporu NUMA, ktora
umoznila zapnut memory hotplug tusim. Pri boote sice pise ze NUMA
konfiguraciu nenasiel a memory hotplug server tiez urcite nepodporuje,
ale podla vypisu "free" uz pouziva vsetku pamat - aj ked kernel stale
pise ze tych 656356k je "absent".

# free -m
             total       used       free     shared    buffers     cached
Mem:          3966       3914         52          0          7       2146
-/+ buffers/cache:       1759       2207
Swap:          980        405        574



-- 
  bYE, Marki



Další informace o konferenci linux