Verze z 19. 1. 2011, 15:57 editovat Lepton7 (diskuse \| příspěvky) 6 editací doplnenie zakladnej definicie a doplnenie odkazov na nie kazdemu zname pojmy v texte ← Přejít na předchozí porovnání		Verze z 19. 1. 2011, 15:58 editovat zrušit editaci Lepton7 (diskuse \| příspěvky) 6 editací doplnenie odkazu Přejít na další porovnání →
Řádek 7: == Extrakce N-gramů == [[:en:Natural_language_processing\|Zpracování přirozeného jazyka]] je obor na rozhraní [[lingvistika\|lingvistiky]] a [[Informatika_(počítačová_věda)\|počítačové vědy]]. Tento pojem stejně symbolizuje zpracování ať už psaného nebo mluveného jazyka pro praktické a užitečné účely: překlad [[jazyk\|jazyků]], získávání znalostí z [[Webový_portál\|webových portálů]], vedení konverzace s počítačem za účelem získání nových, smysluplných informací. V konečném důsledku jde o dosažení lepšího porozumění přirozeného jazyka počítačem. Při řešení úloh z oblasti počítačového [[:en:Natural_language_processing\|zpracování přirozeného jazyka]] se na reprezentaci textu využívají ve většině případů slova. Do popředí se však dostává využívání několika po sobě jdoucích n-tic slov, které se označují jako n-gramy. [[:sk:Extrakcia_n-gramov\|Odkazovaný článek]] se zabývá systémem vyhledávání nejčastějších n-tic slov v rozsáhlém textu. Popsáni jsou v něm základní metody pro extrakci slovních n-gramů:

N-gram: Porovnání verzí