[linux] Text processing (speed)...

Aneta Karnasova sydney.fox na gmx.net
Pondělí Duben 9 08:21:52 CEST 2001


Ahoj!

  Mne sa najviac osvedcil sed. Vyzera to potom:

sed -e s/stary/novy/g < vstup > vystup

30MB subor (par tisic riadkov, pricom v kazdom meni jedno slovo za druhe)
spracoval za 2-3s (PIII, 500MHz).

Tia

> Caute!
>
> Mam problem, a zaujimalo by ma, ako by sa mohol co najlepsie
> vyriesit. V podstate trivialna vec:
>
> Mam textovy subor, a potrebujem skript/program, ktory mi
> ho prebehne a ak najde na niektorom riadku pevne dany
> retazec (ziaden regularny vyraz, ale presne dana sekvencia
> znakov), vymeni mi cely ten riadok za iny riadok. Vstupne
> hodnoty teda su "retazec", "riadok", "/cesta/subor" (vsetko
> to moze byt aj natvrdo zadane v skripte/programe).
>
> V com je zadrhel? Ten spracovavany textovy subor je dost
> velky (radove 10 az 100 MB) a ja potrebujem, aby
> spracovavanie trvalo co najkratsiu dobu a moje pokusne
> skripty bezia niekolko minut. Asi najrychlejsie by bolo
> napisat si na to rovno nieco v asm, ale az tak sa s tym
> babrat nechcem, radsej zostanem u skriptu.
>
> No a otazka: Ake nastroje su na taketo spracovavanie
> najlepsie (co sa tyka rychlosti)? find, grep, awk,...?
> Pripadne ak ma niekto nejaku predstavu, ako by taky
> zoptimalizovany skript vyzeral, moze mi ho poslat?
> Ak sa najde viacero navrhov, mozno nieco skombinujeme...
>
> Jarry


-- 
Sent through GMX FreeMail - http://www.gmx.net



Další informace o konferenci linux