[linux] mod_perl, Twig a chybne kodovanie

Juraj Michalek xmichal5 na informatics.muni.cz
Čtvrtek Květen 15 13:23:16 CEST 2003


> Uz niekolko dni sa babrem so zaujimavym problemom a stale nic.
> Napisal som si jednoduchy CGI skript pracujuci s databazou.
> Vsetko bolo v pohode - ked boli odoslane data do databazy
> v ISO-8859-2, tak sa tam pekne ulozili a nacitali.
> 
> Nasledne som vyvinul dalsi skript, do ktoreho som zaclenil
> Twig nadstavbu nad XML parserom. Vsetko bolo v pohode,
> az kym som nezacal posielat na server data z diakritikou.
>

Problem bol odstraneny pomerne jedonducho.
Pri vytvarani Twig parseru stacilo pridat kluc 

	keep_encoding => 1

Totiz Perl pracuje tak, ze vsetko koduje v zakladnom kodovani.
V pripade, ze je nejaky retazec kodovany inak udrzuje si o tom
informaciu. V pripade zlucenia dvoch retazcov pouzije kodovanie
s vyzsou prioritou, napr. UTF-8.

Teda ak bol jeden retazec v ISO-8859-1 a druhy v UTF-8, tak
po ich contcate vznikne retazec UTF-8.

Twig parser implicitne pracuje s UTF-8 a tak sa kodovanie
UTF-8 prenieslo spajanim retazcov az do najvyzsej vrstvy
a program vsetko vypisoval v UTF-8


Georgik
-- 
-=- -=- -=- -=- -=- -=- -=- -=-
       Juraj Michalek 
   http://kota543.host.sk
   Linux in everyday world
    http://games.linux.sk



Další informace o konferenci linux