[linux] Re: [linux] apache a kodovanie stranok

Ondrej Ivanic ondrej na kmit.sk
Sobota Září 13 12:52:01 CEST 2003


Matus UHLAR - fantomas wrote:
> 
> haluzis? to chces este aj do servera implementovat [xh]tml parser?
> nechces nahodou do apache integrovat jadro mozilly?

Ja urcite nie, w3c. Je v tom trochu gulas. Nic ine sa vsak neda cakat 
ked je to jen kopa doporuceni (standardy to nie su). A ziadny parser tam 
netreba na to staci spravny regexp.

Stranku [1] som prehliadol, ktora hovori o priorite a ta je tiez velmy 
dolezita. Pritom podla [2] by mal web server geberovat HTTP headre z 
meta tagov ktore maju platny http-equiv atribut.

> HTML klient musi casto poznat charset dokumentu PRED tym, ako ho parsuje,
> predoze typ kodovania moze dane parsovanie ovplyvnit.

S parsovanim nieje problem a pri us-ascii, iso*, utf-8 nepotrebujem 
vediet konkretne kodovanie. Obsah meta tagov bude vzdy jasny. Pri uft-16 
a spol. viem ostatne info zizstit podla BOM (Byte Order Mark) na 
zaciatku suboru.

Aby som to uzavrel: z apache treba vyhodit vsetky AddDefaultCharset a 
kodovanie nastavovat v dokumente. (A to este mozeme byt radi ze proxy 
servre s kodovanim nic nerobia aj ked mozu... )

[1] http://www.w3.org/TR/html4/charset.html
[2] http://www.w3.org/TR/html401/struct/global.html#adef-http-equiv

-- 
Ondrej Ivanic
(ondrej na kmit.sk)




Další informace o konferenci linux