Rozpoznávání řeči: Porovnání verzí

Smazaný obsah Přidaný obsah
m Styl
Bez shrnutí editace
Řádek 3:
I když mají mluvčí stejný [[Jazyk (lingvistika)|jazyk]], liší se jejich [[hlas]]ový projev právě v různé intonaci, zabarvení atd. Tyto rozdíly se snaží překonat složité výpočetní operace, takže proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči.
 
Už dnes však existují programy, které reagují na jednoduché hlasové povely. Existují dokonce textové editory, kterým lze text diktovat. V současnosti nejrozšířenějším [[software]] v této oblasti je ''Dragon Naturally Speaking'' aspojený s ''IBM ViaVoice'' alias "Nuance Dragon". V prográmku jménem ''JetVoíce'' můžete ovládat hlasem některé činnosti počítače. Hlasové záznamy jsou v něm vidět v obrazové podobě, kde můžete rozpoznat jak vaše intonace závratně mění způsob, jakým počítač zvuk vnímá.
 
V českém prostředí vyvíjí programy pro rozpoznávání řeči několik výzkumných pracovišť v Liberci, Brně, Praze a Plzni. Nejpokročilejší z nich využívá nejnovějších výsledků výzkumného projektu ''MegaWord.cz'', který probíhá za spolupráce se Západočeskou univerzitou v Plzni (řešitelem projektu je SpeechTech, s.r.o., spoluřešitelem Západočeská univerzita v Plzni). Záměrem a cílem projektu MegaWord.cz je výzkum a experimentální vývoj softwarového systému nové generace pro automatický převod mluvené řeči do textu (dále též „diktovací systém“), tj. systému se širokým využitím, který umožňuje urychlení a usnadnění přípravy – „výroby“ – textových dokumentů. Systém bude pracovat v reálném čase se slovníkem významně převyšujícím milion slov se samozřejmým zajištěním potřebného uživatelsky příjemného prostředí. Na libereckém pracovišti byl vyvinut program pro automatické diktování NewtonDictate (nejlepší český program pro spojité diktování, vyvinutý ve spolupráci s firmou Newton Technologies a.s.) nebo také ATT Toolkit (program pro přepis televizních a rozhlasových pořadů nasazený ve firmě Newton Media).