N-gram: Porovnání verzí

Smazaný obsah Přidaný obsah
doplnenie zakladnej definicie a doplnenie odkazov na nie kazdemu zname pojmy v texte
doplnenie odkazu
Řádek 7:
== Extrakce N-gramů ==
 
[[:en:Natural_language_processing|Zpracování přirozeného jazyka]] je obor na rozhraní [[lingvistika|lingvistiky]] a [[Informatika_(počítačová_věda)|počítačové vědy]]. Tento pojem stejně symbolizuje zpracování ať už psaného nebo mluveného jazyka pro praktické a užitečné účely: překlad [[jazyk|jazyků]], získávání znalostí z [[Webový_portál|webových portálů]], vedení konverzace s počítačem za účelem získání nových, smysluplných informací. V konečném důsledku jde o dosažení lepšího porozumění přirozeného jazyka počítačem.
 
Při řešení úloh z oblasti počítačového [[:en:Natural_language_processing|zpracování přirozeného jazyka]] se na reprezentaci textu využívají ve většině případů slova. Do popředí se však dostává využívání několika po sobě jdoucích n-tic slov, které se označují jako n-gramy. [[:sk:Extrakcia_n-gramov|Odkazovaný článek]] se zabývá systémem vyhledávání nejčastějších n-tic slov v rozsáhlém textu. Popsáni jsou v něm základní metody pro extrakci slovních n-gramů: