[linux] zalohovanie/komprimacia a znakova sada - v archive je chybne kodovanie suborov s diakritikou

Ing. Jan ONDREJ jan.ondrej na upjs.sk
Středa Březen 11 15:51:19 CET 2009


Ahoj,

  pokial pouzivas UTF-8, tak by to malo ist bez problemov.

1. Skus skontrolovat, ci mas nastavene toto kodovanie. Napr. v terminali
   skus toto:

	[ondrejj na work ~]$ echo $LANG
	sk_SK.UTF-8

   Pripadne tam mozes mat en_US.UTF-8, ale to UTF-8 by si na konci mal mat.

2. Skontroluj, ci ma samba spravne nastavene kodovanie. V sucasnych
   systemoch zvycajne nic extra netreba robit, detekne si to same.
   Skontrolujes to jednoducho vypisom ls na niektory adresar, ktory
   obsahuje diakritiku (najlepsie je urobit si viac znakov, napr.
   µąč»ľýáíéúäô§ň)

3. Skus si to zabalit z prikazoveho riadku tar-om, malo by to fungovat a mal
   by si diakritiku vidiet neposkodenu.

Ak toto vsetko preslo, tak je mozne, ze ten webmin nema spravne nastavene
kodovanie UTF-8 alebo aspon proces tar, ktory spusta. Treba to nastavit v
systeme priamo, nie len pre nejakych pouzivatelov.

Zalohovanie s diakritikou UTF-8 by malo fungovat spolahlivo. Ostatne
kodovania mozu mat svoje uskalia, alebo je potrebne rucne definovat
kodovania, co moze byt zvycajne problem.

On Wed, Mar 11, 2009 at 03:42:12PM +0100, patrik na foral.sk wrote:
> Ahoj,
> riesim zalohovanie, no narazam na problem so znakovou sadou. Skusam  
> zalohovat samba (v 3.024) suborovy server, na ktory ukladaju useri z win 
> snanic - nazvy suborov su aj s diakritikou v UTF-8 kodovani. Pri  
> vytvoreni zalohy pomocou webmin modulu "Filesystem Backup" do tar alebo 
> gzip mi to ale zmrsi nazvy suborov - kazdy format to zmrsi trochu inak. 
> Archiv by som potreboval citat aj z win, no kvoli rozhasenemu kodovaniu 
> to je trocha problem. Co robim zle, resp. v com moze byt chyba? Existuje 
> nejaky elegantny sposob, ktorym by som do archivu ulozil subory v 
> "spravnom" kodovani idealne aj s ACL?

Co myslis pod ACL? Zeby samba vedela nejake ACL? :)

Mne UTF-8 kodovanie bezny tar alebo 7zip vpohode zvladaju.

Otazne je, ako spracuje UTF-8 tar windows, ale tiez by to malo fungovat.

> Z win som zvyknuty na nieco taketo:
> rar a C:\BACKUP\Dokumenty.rar -ac -ao -os -r -m5 -rr -dh -inull  
> -agYYYY-MM-DD--HH-MM C:\Dokumenty\*.*

No ked si kupis rar pre linux, tak to mozes robit tiez. Ja som ale radsej
pouzil 7zip, ktory mal u mna asi 4x lepsi kompresny pomer a hlavne ho
netreba kupovat. :-)

		SAL


Daląí informace o konferenci linux