Rozpoznávání řeči: Porovnání verzí

Smazaný obsah Přidaný obsah
RibotBOT (diskuse | příspěvky)
m r2.6.5) (robot přidal: ar:مميزالكلام
Bez shrnutí editace
Řádek 1:
'''Rozpoznávání řeči''' je postup, kdy se podle určitých zaznamenaných vzorků [[zvuk]]u rozpoznává, co bylo [[řeč]]eno. Metoda je zatím velmi citlivá na rozdíly v [[intonace (lingvistika)|intonaci]] i [[výslovnost]]i. Nejvíce propracovaná je tato metoda zatím pro [[angličtina|anglicky mluvícíanglický]] [[populace|populaci]]jazyk. Pro češtinu (a obecně jakýkoliv ohebný jazyk) jsou tyto programy složitější převážně díky mnohem větším slovníkům, které musí obsahovat všechny možné varianty slov (v angličtině jedno slovo "woman" má v češtině mnohem více možných překladů, např.: "žena", "ženy", "ženě", "ženu", ...)
 
I když mají mluvčí stejný [[Jazyk (lingvistika)|jazyk]], liší se jejich [[hlas]]ový projev právě v různé intonaci, zabarvení atd. Tyto rozdíly se snaží překonat složité výpočetní operace, takže proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči.
Řádek 5:
Už dnes však existují programy, které reagují na jednoduché hlasové povely. Existují dokonce textové editory, kterým lze text diktovat. V současnosti nejrozšířenějším [[software]] v této oblasti je ''Dragon Naturally Speaking'' a ''IBM ViaVoice''. V prográmku jménem ''JetVoíce'' můžete ovládat hlasem některé činnosti počítače. Hlasové záznamy jsou v něm vidět v obrazové podobě, kde můžete rozpoznat jak vaše intonace závratně mění způsob, jakým počítač zvuk vnímá.
 
V českém prostředí vyvíjí programy pro rozpoznávání řeči několik výzkumých procovišť v Liberci, Brně, Praze a Plzni. Nejpokročilejší z nich využívá nejnovějších výsledků výzkumného projektu ''MegaWord.cz'', který probíhá za spolupráce se Západočeskou univerzitou v Plzni. (řešitelřešitelem projektu je SpeechTech, s.r.o., spoluřešitelem Západočeská univerzita v Plzni). Záměrem a cíli výzkumnéhocílem projektu MegaWord.cz je výzkum a experimentální vývoj softwarového systému nové generace pro automatický převod mluvené řeči do textu (dále též „diktovací systém“), tj. systému se širokým využitím, který umožňuje urychlení a usnadnění přípravy – „výroby“ – textových dokumentů. Systém bude pracovat v reálném čase se slovníkem významně převyšujícím milion slov se samozřejmým zajištěním potřebného uživatelsky příjemného interfaceprostředí.
Na libereckém pracovišti byl vyvinut program pro automatické diktování NewtonDictate (nejlepší český program pro spojité diktování, vyvinutý ve spolupráci s firmou Newton Technologies a.s.) nebo také ATT Toolkit (program pro přepis televizních a rozhlasových pořadů nasazený ve firmě Newton Media).
 
Jednou z brandovaných variantu produktu MegaWord je software ''NovaVoice®'', který je distribuován společností Consulting Company Novasoft a.s.. Tento produkt byl v roce 2008 oceněn Křišťálovým diskem na výstavě Invex. Dále pak v roce 2009 za tento produkt získala firma CCNovasoft ocenění Česká hlava.
 
Programy využívající počítačové rozpoznávání řeči mohou také sloužit pro hendikepované osoby (například hlasové ovládání počítače).
 
 
=== Metody počítačového rozpoznání řeči ===
Pro počítačové rozpoznání řeči se využívá algoritmu HMM ([[en:Hidden Markov model]] - Skryté Markovské modely). Tento model je statistický Markovský model, který obsahuje skryté stavy.
 
{{Pahýl - počítače}}