N-gram: Porovnání verzí

Smazaný obsah Přidaný obsah
imho {{subst:Urgentně upravit}}
Bez shrnutí editace
Řádek 1:
{{Urgentně upravit/dne|20110117225220}}
 
= N-gram =
'''N-gram''' je definován jako sled n po sobě jdoucích položek z dané sekvence. Ze sémantického pohledu může být tato posloupnost buď posloupností slov nebo písmen. V praxi se častěji vyskytují n-gramotnosti jako sled slov. Sled dvou po sobě jdoucích čísel bývá často označován jako bigram, pro sled tří položek je zažitý pojem trigram. Od čtyř a výše se používá označení N-gram, kde N je nahrazeno počtem za sebou jdoucích elementů.
 
 
== Extrakce N-gramů ==