[linux] Text processing (speed)...

Michal Maga maga na mailbox.sk
Pondělí Duben 9 11:15:57 CEST 2001


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Ehm, ak som dobre pochopil, toto nie je to, co Jarry chcel. Toto stary
text vymeni za novy a nie ak v riadku najde stary text, riadok vymeni
za novy. Am I right?

No ja by som to hodil awkom, mam s nim len dobre skusenosti. Ale
rychlost ti nepoviem, tie skripty mi bezia na 386,33MHz a 180MB HDD
:-))))). Ten udaj by ti bol asi na nic.

M na gic

>
>  Mne sa najviac osvedcil sed. Vyzera to potom:
>
>sed -e s/stary/novy/g < vstup > vystup
>
>30MB subor (par tisic riadkov, pricom v kazdom meni jedno slovo za
druhe)
>spracoval za 2-3s (PIII, 500MHz).
>
>Tia
>
>> Caute!
>>
>> Mam problem, a zaujimalo by ma, ako by sa mohol co najlepsie
>> vyriesit. V podstate trivialna vec:
>>
>> Mam textovy subor, a potrebujem skript/program, ktory mi
>> ho prebehne a ak najde na niektorom riadku pevne dany
>> retazec (ziaden regularny vyraz, ale presne dana sekvencia
>> znakov), vymeni mi cely ten riadok za iny riadok. Vstupne
>> hodnoty teda su "retazec", "riadok", "/cesta/subor" (vsetko
>> to moze byt aj natvrdo zadane v skripte/programe).
>>
>> V com je zadrhel? Ten spracovavany textovy subor je dost
>> velky (radove 10 az 100 MB) a ja potrebujem, aby
>> spracovavanie trvalo co najkratsiu dobu a moje pokusne
>> skripty bezia niekolko minut. Asi najrychlejsie by bolo
>> napisat si na to rovno nieco v asm, ale az tak sa s tym
>> babrat nechcem, radsej zostanem u skriptu.
>>
>> No a otazka: Ake nastroje su na taketo spracovavanie
>> najlepsie (co sa tyka rychlosti)? find, grep, awk,...?
>> Pripadne ak ma niekto nejaku predstavu, ako by taky
>> zoptimalizovany skript vyzeral, moze mi ho poslat?
>> Ak sa najde viacero navrhov, mozno nieco skombinujeme...
>>
>> Jarry
>
>
>-- 
>Sent through GMX FreeMail - http://www.gmx.net
>_______________________________________________
>linux mailing list
>linux na rak.isternet.sk
>http://rak.isternet.sk/mailman/listinfo/linux


-----BEGIN PGP SIGNATURE-----
Version: Encrypted with PGP Plugin for Calypso

iQA/AwUBOtFvvS8/kAUlvfvNEQJUwQCgqHZrZAS2b4if9rigE7qRoMbEvCQAnR4k
D9byWp0XiA6JK7zIuYKKLsfK
=uV3O
-----END PGP SIGNATURE-----





Další informace o konferenci linux