Verze z 4. 10. 2017, 11:00 editovat JAnDbot (diskuse \| příspěvky) Roboti 1 711 601 editací m Robot: přidáno {{Autoritní data}} ← Přejít na předchozí porovnání		Verze z 25. 6. 2018, 07:30 editovat zrušit editaci Lenoch Ondra (diskuse \| příspěvky) 327 editací m úprava stylu Přejít na další porovnání →
Řádek 10: == Závislost na mluvčím == Rozpoznávání řeči může být jednak závislé na mluvčím (SD''speaker -dependent'', ~~Speaker Dependent~~SD) či na mluvčím nezávislé (SI''speaker -independent'', ~~Speaker Independent~~SI). Systémy, které jsou závislé na mluvčím dosahují pro danou osobu lepších výsledků, ale jejich nevýhodou je, že mluvčí musí namluvit několik hodin nahrávek, aby bylo možné natrénovat dobré modely. Systémy, které jsou nezávislé na mluvčím jsou natrénované pomocí nahrávek od velkého množství lidí. Nedosahují ovšem takové úspěšnosti jako systémy SDzávislé na mluvčím. Bylo proto vyvinuto několik metod, které SI model adaptují na konkrétního mluvčího. Mezi základní metody adaptace patří metody MAP ([[maximální aposteriorní pravděpodobnost]], [[:en:Maximum A Posteriori\|Maximum a posteriori estimation~~]] - [[Maximální Aposteriorní Pravděpodobnost~~]]), MLLR ([[Maximum Likelihood Linear Regression]]) a jejich různé variace. == Metody počítačového rozpoznání řeči == Pro počítačové rozpoznání řeči se využívá algoritmu '''HMM''' ([[~~Skrytý~~skrytý Markovův model\|~~Skryté~~skryté ~~Markovovské~~Markovovy ~~Modely~~modely]]). Tento model je statistický Markovovský model, který obsahuje skryté stavy. HMM se používají v rozpoznávání řeči, protože řečový signál může být chápán jako po částech stacionární signál, nebo po krátkých časových úsecích stacionární signál. V krátkém čase (např. 10 ms), může být řeč aproximována jako stacionární proces. Pro rozpoznávání se často používá [[Viterbiho algoritmus]] ~~([[:en:Viterbi algorithm]])~~. Tato metoda se používá pro spojité rozpoznávání řeči, což je mnohem komplexnější a náročnější úloha než rozpoznávání izolovaných slov. Při vyslovování izolovaných slov se mluvčí více soustředí na konkrétní slovo a vyslovuje jej zřetelněji. Při spojité řeči dochází také k některým jevům jako je například spodoba slov (poslední hláska ve slově je ovlivněna následující hláskou, kterou začíná druhé slovo), polykání hlásek, apod. Další využívanou metodou je metoda '''DTW''' ([[~~:en:Dynamic~~dynamické ~~Time~~borcení ~~Warping~~času]] -, [[~~Dynamické~~:en:Dynamic ~~Borcení~~Time ~~Času~~Warping]]). Tato metoda je vhodná pro rozpoznávání izolovaných slov (například pro hlasové ovládání počítače), protože je zapotřebí mít ve slovníku uloženou modelovou nahrávku každého použitého slova. Metoda měří podobnost mezi dvěma nahrávkami slov (popřípadě slovních spojení) a snaží se najít nejlepší shodu - určité úseky zkracuje či prodlužuje tak, aby byl rozdíl mezi nahrávkami co nejmenší. == Rozpoznávání řeči pro češtinu ==

Rozpoznávání řeči: Porovnání verzí