[linux] mail open relay ? telecom

Matus UHLAR - fantomas uhlar na fantomas.sk
Středa Prosinec 10 10:15:30 CET 2003


On 09.12 20:17, Tibor Pittich wrote:
> > ja mam autolearn on, ale zatial sa velmi neprejavoval.
> 
> iste, pretoze auto_learn_threshold_spam je nastaveny az na 20, a take
> spamy nechodia kazdy den.. rovnako sa da nastavit samozrejme aj hranica
> pre autolearning ham-ov..

yo, s tym som sa nehral

> > vsetky maily oznacene spamassassinom ako spamy pcham do foldera
> > probably-spam, a pravidelne vsetky (okrem tych co uz maju RAZOR_CHECK)
> > reportnem do razoru:
> > 
> > % razor-report < probably-spam
> 
> ano, takto to robia amateri. sikovnejsi si precitaju manualovu stranku
> a pouzivaju spamassassin -r pretoze vedia, ze nie iba razor-om je
> antispam system dobry..

tak to robia lameri. ti sikovnejsi si miesto pipovania niekolko mailov do
spamassassina z maileras spustia razor-report a sa-learn nad mailboxov,
cim sa pocet prikazov redukuje na 2 pre lubovolny pocet spamov v mailboxe

> > akurat vcera som spamassassin naucil definiciu spamov:
> > 
> > % sa-learn --spam --mbox -L spam
> 
> uzasny pokrok. akurat ten prepinac -L akosi mi tam nesedi:
> 
> -L, --local
>     Do not perform any network accesses while learning details about
>     the mail messages.  This will speed up the learning process, but
>     may result in a slightly lower accuracy.
> 
>     Note that this is currently ignored, as current versions of SpamAs-
>     sassin will not perform network access while learning; but future
>     versions may.
> 
> takze tvoja verzia to snad podporuje?..

cital som len prvu stranku, tam sa nic viac nespomina:

--no-rebuild                      Skip building databases after scan
-L, --local                       Operate locally, no network accesses
--import                          Upgrade data from an earlier database version

> > akurat som nemal vhodnu davku nie-spamov, co sa vzapati ukazalo ako nie
> > najstastnejsi napad, pretoze mi trochu stupli false-positives (nejake boli
> > uz predtym - ked do nejakeho mailinglistu posle anonymny lamer mail cez
> > pochybny server).
> 
> a co tak nastavit pre zaciatok body za bayes filtre este nizssie ako
> standardne, ak uz teda dany admin nevie spravne nakrmit bayes databazu
> aj spamom aj hamom.. 

kvoli false positives radsej nie.

> hovori sa, ze bayes filtre pri 200 vzorkach jedneho aj druheho uz
> zacinaju byt velmi ucinne.
> pre spamassassin >2.55 sa-learn --dump data je zaujimavy prikaz potom..
> 
> > Takze: bayes funguje pekne, ale ak mu nepredhodite davku korektnych
> > mailov, moze ako spamy zacat oznacovat vselico.
> 
> toto je co za kravinu? bayes logika neoznacuje nic ako spam, alebo
> nespam. iba hovori, ze na aku percentualnu pravdepodobnost je dana
> sprava oznacitelna ako spam. navyse neexistuje nic ako 100%, maximalne
> priradi 99% ;)

dobre, takze, zmenim "moze ako spamy zacat oznacovat vselico" na
"moze priradovat vselicomu vysoke percento pravdepodobnosti ze sa jedna o
spam".

trochu je tu v konflikte matematicke a ludske vyjadrovanie sa, pretoze v
matematike "vzdy" znamena "v 100 % pripadov", pricom v ludskej logike
"vzdy" znamena "vo vysokom percente pripadov"

> spamassassin potom ma pre jednotlive stupne urcite body, ktore sa
> samozrejme daju nastavovat, ak uz clovek ma databazu dostatocne
> kvalitnu. 

ak budes bayes krmit sj spamami, naplni si databazu slovami ktore sa v
nich vyskytuju casto, ale nema sancu zistit ci sa nahodou tie iste slova
casto nevyskytuju aj v ham mailoch. Preto mu treba predhodit oboje...

-- 
Matus UHLAR - fantomas, uhlar na fantomas.sk ; http://www.fantomas.sk/
Warning: I don't wish to receive e-mail advertising to this address.
Varovanie: Nezelam si na tuto adresu dostavat akukolvek reklamnu postu.
Fighting for peace is like fucking for virginity...



Další informace o konferenci linux