[linux] Problem s pamatou pri novom kerneli
Marek Podmaka
marki na marki-online.net
Čtvrtek Červen 25 10:16:03 CEST 2009
Cau,
Wednesday, June 24, 2009, 17:54:27, Lubomir Host wrote:
> ak ti server "z nicoho nic" padal kazdych 10 dni, tak by to mohla byt
> chybna ramka. Co pise dmesg pri takom pade?
No on nepadal z nicoho nic. Zacal padat po reinstalacii na debian
lenny, predtym isiel par rokov bez problemov. Server proste
zahangoval, obcas nejaky proces nieco napisal do syslogu, ale nedalo
sa ani prihlasit. Zacalo to vzdy nejakym dumpom stacku kernelu, boli
tam aj nejake funkcie ohladne xfs a swapu.
S tymto novym kernelom sa mi to este nestalo.
> Skus pouzit memtest a otestovat ramku v tom serveri (idealne v rovnakej
> konfiguracii, ako ju mas zalozenu teraz). Cize bootnut z nejakeho CD
> a spustit memtest86.
Je to HP Proliant server s ECC RAM, takze blbosti by to robit nemalo.
Single bit error by to malo opravit a double bit error by mal sposobit
bud vytuhnutie alebo rovno reboot.
Ale vyzera to, ze uz som to vyriesil. Este raz som pozrel rozdiel
medzi mojim a debian kernelom a skusil som zapnut podporu NUMA, ktora
umoznila zapnut memory hotplug tusim. Pri boote sice pise ze NUMA
konfiguraciu nenasiel a memory hotplug server tiez urcite nepodporuje,
ale podla vypisu "free" uz pouziva vsetku pamat - aj ked kernel stale
pise ze tych 656356k je "absent".
# free -m
total used free shared buffers cached
Mem: 3966 3914 52 0 7 2146
-/+ buffers/cache: 1759 2207
Swap: 980 405 574
--
bYE, Marki
Další informace o konferenci linux