[linux] OT: Synteza reci

Pavol Lajciak Pavol.Lajciak na fedu.ku.sk
Pátek Červen 2 08:13:25 CEST 2006


Preposielam jeden mail. a zopar liniek
------------------------------------------

Linky:

http://noel.feld.cvut.cz/vyu/dzr/dzr12/
http://noel.feld.cvut.cz/vyu/dzr/

http://www.fi.muni.cz/usr/jkucera/pv109/2003/xgrandis.htm
http://www.elsnet.org/survey/
http://noel.feld.cvut.cz/speechlab/start.php?page=welcome&lang=cz
http://noel.feld.cvut.cz/vyu/dzr/dzr12/
http://noel.feld.cvut.cz/vyu/dzr/


Mail
----

mozno ta to bdue zaujimat :))

Dobrý den,
V poslední době se v novinách / televizi objevila řada informací o rozvoji
automatického rozpoznávání a syntézy řeči. Zvláště nás zaujala informace,
že uživatelé z řad nevidomých používají pro čtení na počítači málo kvalitní
počítačovou syntézu a rádi by měli kvalitnější produkt, o kterém však neví.
Chtěl bych Vám proto podat několik informací o Oddělení umělé inteligence
(
http://ui.zcu.cz/)
na Katedře kybernetiky Západočeské univerzity v Plzni.
Na vývoji hlasovových technologií zde pracuje řada odborníků pod vedením
prof. Psutky a doc. Müllera již řadu let.

V oblasti syntézy řeči se řadíme mezi přední výzkumné týmy celosvětového
rozsahu. Kromě syntézy češtiny pracujeme i na dalších jazycích (sloveština,
němčina, připravuje se angličtina, francouzština, ...). Interaktivní ukázky
si můžete prohlédnout na
http://www.speechtech.cz/demo.php.
V současné době
probíhá před uvedením na trh závěrečné testování programu pro syntézu řeči
podporující SAPI.

Rozpoznávání řeči a vývoj hlasových dialogových systémů také patří mezi
naše
priority. Kromě řady publikací na prestižních mezinárodních konferencích
jsme nezapomněli ani na aplikační část, kde mohu jmenovat několik
referencí:

-- Telefonní hlasové aplikace na ZČU (
http://voice.zcu.cz/) -
např
výsledky
přijímacího řízení na ZČU, přihlašování studentů na zkoušky pomocí
telefonu - v obou případech použity technologie automatického
rozpoznávání a
syntézy řeči
-- Hlasová syntéza pro produkt VoiceMail společnosti Kerio Technologies,
s.r.o., uživatel např. Ernst & Young ČR
-- Hlasová syntéza pro čtení e-mailů a dokumentů MS Wordu produktu CIT.CZ,
distributor CIT.CZ, spol. s r.o.
-- Čtení e-mailu v automobilovém palubním počítačovém systému, uživatel
Škoda Auto, a.s.
-- Modul TTS syntézy pro IVR systémy společnosti AVAYA
-- TTS syntéza pro posílání hlasových SMS zpráv na pevnou linku -
uživatel a
provozovatel Fincom - Materna Communications, a. s., ČESKÝ TELECOM, a.s.,
T-Mobile Czech Republic a.s., Eurotel Praha, spol. s r. o., Český Mobil
a.s.
(Oskar); textová SMS zpráva poslaná z mobilního telefonu či telefonního
automatu podporujícího kartu TRICK je přečtena počítačovou syntézou do
telefonu pevné sítě; běží v celé telekomunikační síti České republiky.
-- Automatická telefonní spojovatelka
-- čtení aktálního zprávodajství přes telefon ze serveru zprávy.idnes.cz -
můžete vyzkoušet demo na tel. čísle 377 63 8805

Jakékoliv dotazy, náměty a připomínky,
plus nápady, jak využít rozpoznávání/syntézu řeči pro zlepšení života
nevidomých jsou vítány...

S přátelským pozdravem
Luboš Šmídl
smidl na kky.zcu.cz -
377 63 2528
Katedra kybernetiky
Fakulta aplikovaných věd
Západočeská univerzita v Plzni
Univeritní 22
306 14 Plzeň

Druhá informace:
Kromě tohoto projektu jsem nedávno viděl na konferenci INSPO věnované
každoročně tématu handicapovaní a internet projekt profesora Nouzy z
technické univerzity v Liberci speech recognition program, který velmi
kvalitně rozpoznal lidskou řeč, český jazyk, a dokázal na příkazy
reagovat. Předvedli velmi zdařile nejen práci ve Windows - spuštění
programů, práci v kalkulačce, psaní ve Wordu či poznámkovém bloku, ale
dokonce i malování - díky přesunu myši dokázali namalovat čtverec, který
byl protnut kružnicí!
Řadu let už v Liberci funguje i telefonická služba, přes kterou je možné
zjišťovat například na počítači s speech recognition odjezdy v jízdních
řádech. Služba se jmenuje Infocity a je dostupná na telefonu 485 353 900.

Třetí informace:
Ještě tu mám jednu novinku:
pokud si chcete vyzkoušet trochu jinou hlasovou synthézu a uložit si
například její vzorek do wavu, jděte na stránku
http://epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech
a vložte nebo napište
do políčka relativně krátký text. V přepínačích pak můžete nastavit
vybranou hlasovou synthézu. Dole pak stiskněte tlačítko Posli mi zvukový
výstup. V následném dialogovém okně pak můžete dát buď spustit nebo
uložit. Po spustit se Vám stahne wav do temp složky a odtud se zasociuje
program, který je ve vašem počítači přidružen k přehrávání wavů,
například to může být i WinAmp nebo Windows Media Player.

Čtvrtá informace:
Ještě jedna stránka s vývojem jedné české hlasové synthézy:
http://www.gb-soft.cz/produkty-tts.htm
Jedná se o program TTS - Text to Speech - Řekni to. Můžete si ho
stahnout a vyzkoušet.
Doufám, že Vám nenaboří Wintalker Voice nebo Hlas - tedy bez záruky a na
Vaše riziko. Zatím jsem nezkoušel.
------- End of Forwarded Message -------


-----------------------------
mailto:ortancikova na fedu.ku.sk



-- 
S uctou
Pavol Lajciak

Pedagogicka fakulta
Katolicka Univerzita
Katedra informatiky
Namestie Andreja Hlinku 56
034 01 Ruzomberok
tel: +421 44 4320 961 kl. 333
Pavol (dot) Lajciak (at) fedu (dot) ku (dot) sk
http://pf.ku.sk/lajciak/





Dobrý den,
V poslední době se v novinách / televizi objevila řada informací o rozvoji
automatického rozpoznávání a syntézy řeči. Zvláště nás zaujala informace,
že uživatelé z řad nevidomých používají pro čtení na počítači málo kvalitní
počítačovou syntézu a rádi by měli kvalitnější produkt, o kterém však neví.
Chtěl bych Vám proto podat několik informací o Oddělení umělé inteligence
(
http://ui.zcu.cz/)
na Katedře kybernetiky Západočeské univerzity v Plzni.
Na vývoji hlasovových technologií zde pracuje řada odborníků pod vedením
prof. Psutky a doc. Müllera již řadu let.

V oblasti syntézy řeči se řadíme mezi přední výzkumné týmy celosvětového
rozsahu. Kromě syntézy češtiny pracujeme i na dalších jazycích (sloveština,
němčina, připravuje se angličtina, francouzština, ...). Interaktivní ukázky
si můžete prohlédnout na
http://www.speechtech.cz/demo.php.
V současné době
probíhá před uvedením na trh závěrečné testování programu pro syntézu řeči
podporující SAPI.

Rozpoznávání řeči a vývoj hlasových dialogových systémů také patří mezi
naše
priority. Kromě řady publikací na prestižních mezinárodních konferencích
jsme nezapomněli ani na aplikační část, kde mohu jmenovat několik
referencí:

-- Telefonní hlasové aplikace na ZČU (
http://voice.zcu.cz/) -
např
výsledky
přijímacího řízení na ZČU, přihlašování studentů na zkoušky pomocí
telefonu - v obou případech použity technologie automatického
rozpoznávání a
syntézy řeči
-- Hlasová syntéza pro produkt VoiceMail společnosti Kerio Technologies,
s.r.o., uživatel např. Ernst & Young ČR
-- Hlasová syntéza pro čtení e-mailů a dokumentů MS Wordu produktu CIT.CZ,
distributor CIT.CZ, spol. s r.o.
-- Čtení e-mailu v automobilovém palubním počítačovém systému, uživatel
Škoda Auto, a.s.
-- Modul TTS syntézy pro IVR systémy společnosti AVAYA
-- TTS syntéza pro posílání hlasových SMS zpráv na pevnou linku -
uživatel a
provozovatel Fincom - Materna Communications, a. s., ČESKÝ TELECOM, a.s.,
T-Mobile Czech Republic a.s., Eurotel Praha, spol. s r. o., Český Mobil
a.s.
(Oskar); textová SMS zpráva poslaná z mobilního telefonu či telefonního
automatu podporujícího kartu TRICK je přečtena počítačovou syntézou do
telefonu pevné sítě; běží v celé telekomunikační síti České republiky.
-- Automatická telefonní spojovatelka
-- čtení aktálního zprávodajství přes telefon ze serveru zprávy.idnes.cz -
můžete vyzkoušet demo na tel. čísle 377 63 8805

Jakékoliv dotazy, náměty a připomínky,
plus nápady, jak využít rozpoznávání/syntézu řeči pro zlepšení života
nevidomých jsou vítány...

S přátelským pozdravem
Luboš Šmídl
smidl na kky.zcu.cz -
377 63 2528
Katedra kybernetiky
Fakulta aplikovaných věd
Západočeská univerzita v Plzni
Univeritní 22
306 14 Plzeň

Druhá informace:
Kromě tohoto projektu jsem nedávno viděl na konferenci INSPO věnované
každoročně tématu handicapovaní a internet projekt profesora Nouzy z
technické univerzity v Liberci speech recognition program, který velmi
kvalitně rozpoznal lidskou řeč, český jazyk, a dokázal na příkazy
reagovat. Předvedli velmi zdařile nejen práci ve Windows - spuštění
programů, práci v kalkulačce, psaní ve Wordu či poznámkovém bloku, ale
dokonce i malování - díky přesunu myši dokázali namalovat čtverec, který
byl protnut kružnicí!
Řadu let už v Liberci funguje i telefonická služba, přes kterou je možné
zjišťovat například na počítači s speech recognition odjezdy v jízdních
řádech. Služba se jmenuje Infocity a je dostupná na telefonu 485 353 900.

Třetí informace:
Ještě tu mám jednu novinku:
pokud si chcete vyzkoušet trochu jinou hlasovou synthézu a uložit si
například její vzorek do wavu, jděte na stránku
http://epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech
a vložte nebo napište
do políčka relativně krátký text. V přepínačích pak můžete nastavit
vybranou hlasovou synthézu. Dole pak stiskněte tlačítko Posli mi zvukový
výstup. V následném dialogovém okně pak můžete dát buď spustit nebo
uložit. Po spustit se Vám stahne wav do temp složky a odtud se zasociuje
program, který je ve vašem počítači přidružen k přehrávání wavů,
například to může být i WinAmp nebo Windows Media Player.

Čtvrtá informace:
Ještě jedna stránka s vývojem jedné české hlasové synthézy:
http://www.gb-soft.cz/produkty-tts.htm
Jedná se o program TTS - Text to Speech - Řekni to. Můžete si ho
stahnout a vyzkoušet.
Doufám, že Vám nenaboří Wintalker Voice nebo Hlas - tedy bez záruky a na
Vaše riziko. Zatím jsem nezkoušel.
	




-- 
S uctou
Pavol Lajciak

Pedagogicka fakulta
Katolicka Univerzita
Katedra informatiky
Namestie Andreja Hlinku 56
034 01 Ruzomberok
tel: +421 44 4320 961 kl. 333
Pavol (dot) Lajciak (at) fedu (dot) ku (dot) sk
http://pf.ku.sk/lajciak/



Další informace o konferenci linux