[linux] Reviza SK-Ispell
Marek Grac
xgrac na informatics.muni.cz
Čtvrtek Květen 30 16:44:05 CEST 2002
Radamsava,
Vzhladom na to, ze som sa o cosi podobne pokusal, tak chapem o co
ti ide :) snad len par postrehov. A kedze by snad mohli zaujat aj niekoho
ineho, tak to posielam aj do konfery.
> Avsak niekolko testov ukazalo, ze bude treba skontorlovat pravidla v
> affix subore - su tam zadefinove casovania, sklonovania atd...
> Kedze sa jedna o pomerne rozsiahlu pracu, hladam ludi, ktori by sa na to
> so mnou podujali.
Zakladny problem bol v pocte moznych affixovych tried, ktore
ispell ponukal (mozno ich uz zvlada aj viac). ale narvat tam slovencinu
nebude trivialny problem (bude treba spajat rozlicne triedy, ktore su
disjunktne napr. sloveso + prid. meno). Verim, ze taketo problemy v nicom
novsom nie su.
Na druhej strane neviem na kolko si sledoval ten datovy subor s
ispellom a prisiel na chybovost samotnych slov. Pocet nespravnych slov je
(podla toho co som pozeral) v jednotkach percent, co je prilis vela :(
(aspon pre mna).
> Podrobnejšie by som informoval pripadnych zaujemncov do 2-3 tyzdnou.
> Ozvite sa na moj sukromny email (pripadne aj info o tom, ktory flag by
> ste chceli revidovat, pripdne k comu mate dobru literaturu - slovesa,
> pridavne mena, podst. mená)
Plz, zarad si ma do tohoto listu.
> PS: Pokial sa vám zdá, Ĺľe na to nemáte, ale máte legálny prĂstup k
> nejakej kvalitnej kontrole pravopisu (ta v t602 nie je dobra) dajte
> mi vediet.
Jediny program, ktory by na to siel vyuzit a ma 'vcelku' slusnu
kvalitu je 'lemma' (bezi aj pod Linuxom) (Sevecek, 1995). Jedna sa sice o
morfologicky analyzator, ale vyuzit by siel. Priklad:
: sladkosti
1. <s> sladkos-t-i (209)
<l> sladkos
<c> subs Fem sg #236
<c> subs Fem pl #14
: linux
--- not found
: ut
1. <s> ut (219)
<l> ut
<c> subs Any pl #2
Mimochodom, prave dnes som si nezavisle (na tomto e-maile) konecne
dohodol zadanie bakalarskej prace na temu zlepsenie kvality slovenskeho
slovnika :) u nas v labaku (Laborator zpracovani prirozeneho jazyka).
m,
--
[****************************][*************************************]
[ marek 'marx' grac / gerard ][ We are all apprentices in a craft ]
[ ][ where no-one ever becomes a master. ]
[ xgrac na fi.muni.cz ][ Ernest Hemingway ]
[****************************][*************************************]
Daląí informace o konferenci linux