[linux] Software RAID

Peter Surda psurda na byte.at
Pátek Únor 4 10:31:37 CET 2000


Nazdarek

Slyste moje skusenosti so %subj.% a veciami s s tym suvisiacimi.

Odisiel nam na servri disk, tak som sa rozhodol spravit software RAID-1
(mirroring) s 2mi diskami (ide). Su to 12,5 gigove Quantumy, 9/5400 (viac aj
tak netreba, lebo server ma iba 10MBit sietovku). Pocitac je P/166/48 s
chipsetom Intel 430HX. Jeden disk som dal na hda a druhy na hdc, na hdb je
este jeden 16,4 gigovy Seagate s linuxovskymi distribuciami a tak.
Napartisnoval som kazdy disk asi takto:

20M ext2 (na jadro)
128M swap (dolezite do optionoch vo fstabe dat rovnaku prioritu)
1,5G md0 (root)
4,5G md1 (public)
zvysok (asi 6,4G) md2 (/home/users1)

Prve prekvapco bolo, ze redhetovsky (6.1) instalacny program akosi nevie
spravit root partisnu na raid zariadeni. Taxom zrusil md1 a dal root na tu 4,5
gigovu partisnu.

Po reboote som spravil nainicializoval md0 a md2 a spravil mke2fs. Potom som
siel do runlevelu 1, remountoval / ro a tarom premiestnil na md0. Upravil
lilo.conf, spustil lilo a rebootol. Kedze system nenabehol, nebootoval som
staru root partisnu, vytvoril initrd (redhetacky skript mkinitrd to v pohode
zvladol), znova spustil lilo a rebootol.

Pot tychto machinacia root-device na software-raid ide absolutne v pohode.
Potom som dorobil md1 a nastavil system.

Este by som chcel podotknut, ze resyncovanie sa deje v pozadi s nizkou
prioritou, takze beh systemu to ovplyvnuje minimalne a da sa s tymi
zariadeniami pracovat okamzite po inicializacii. Informacie o soft-raid sa
daju ziskat cat /proc/mdstat, je tam stav zariadeni, popripade ze resync je na
55% hotovy a bude to este trvat este 5 minut, alebo je resync DELAYED lebo na
druhej partisne na tom istom disku sa uz resync robi.

Tuning: Zapnutie BM-DMA (hdparm -c1d1u1), vhodne parametre mke2fs (man mke2fs)
Performance: hdparm -t /dev/hda -> 9,9 MB/s
             hdparm -t /dev/md0 -> 7,5 MB/s

Kopirovanie velkych suborov (1G) z adresara mountuteho na md2 do adresara
mountnuteho na md1 zvlada 2-3 MB/s, co IMHO vobec nie je zle.

Integrity: skusil som za behu surovo odpojit disk, co bol asi zly napad, lebo
potom nevedel vobec robit s prvym IDE kanalom. Ked som ho znovu repluggol,
Raid subsystem povedal, ze hda5 je pokazeny a odpaja ho. Dalej som nadabil na
raidhotadd a raidhotremove, ktore som aj vyskusal (raidhotadd /dev/md0
/dev/hda5). Okamzite zacal resyncovat a za par minut bol hotovy.

Dalej som skusal tvrdy reset. fsck (1,5G + 4,5G + 6,4G (md) + 16,4G =~ 30G,
zhruba do 70% plne) trval 7,5 minuty (nieco fsckoval paralelne), co je podla
mna uplne super. Potom este asi pol hodinu resyncoval (ale to za behu
systemu).

Este som kupil aj velky ventilator a disky namontoval tak, aby medzi nimy bolo
volne miesto na prudenie vzduchu. Ked sa tych diskov chytim rukou, ich teplotu
by som oznacil za "vlaznu".

Okrem toho som si spravil script rilo (RAID-LILO), ktory skopiruje hda1 na
hdc1 (tam je jadro) a svacne lilo aj na hda aj na hdc, takze teoreticky by mal
system komplet nabehnut aj s jednym diskom. Teoreticky preto, lebo moj bios
nevie bootovat zo secondary mastera. A este som spravil dalsi skript na
automatizaciu hotpluggingu, lebo pokial si raid mysli, ze zariadenie je OK,
tak hotremove nejde.

Summary:

Plusy:
- lacne jaxvina (2 disky plus ventilator stali 4000 silingov), ostatny HW na
	servri je najslabsi v celej miestnosti.
- rychle jaxvina
- bezpecne jaxvina
- funguje hotplugging
- funguje root partisna na raid-zariadeni

Minusy:
- hotplugging nie je automaticky (to je IMHO skor defekt IDE systemu). Na SCSI
	som to neskusal.
- jadro nemoze byt na raid (co je pochopitelne, ale da sa to obabrat)
- swap partisna nemoze byt na raid zariadeni.

Celkovo:
- odporucam

Bye,

Peter Surda (Shurdeek) <surda na bigfoot.com>, ICQ 10236103

--
gawk; grep; touch; unzip; touch; gasp; finger; gasp; mount; fsck;\
more; yes; gasp; umount; make clean; make mrproper



Další informace o konferenci linux