Fulltextové vyhledávání: Porovnání verzí

Smazaný obsah Přidaný obsah
Addbot (diskuse | příspěvky)
m Bot: Odstranění 11 odkazů interwiki, které jsou nyní dostupné na Wikidatech (d:q83540)
Řádek 9:
Pokud je ovšem množství dokumentů potenciálně větší než kapacita vyhledávacího algoritmu, je pro udržení rychlé odezvy hledání důležité rozdělit vyhledávání do dvou úkolů: indexování a vyhledávání. Indexovací fáze prochází text ve všech dokumentech a vytváří seznam [[klíčové slovo|klíčových termínů]], často nazývaný ''index'', korektnější termín je [[konkordance]]. Ve vyhledávací fázi, kdy se provádí specifický dotaz, je prohledáván pouze k tomu připravený index, namísto originálních dokumentů.
 
Indexer vytváří záznam v indexu pro každý výraz, nebo slovo, které najde v dokumentu a jeho relativní pozici v dokumentu. Obvykle indexer ignoruje tzv. stop-slova, jako jsou spojky a předložky, které jsou příliš obecné a významově bezvýznamné pro hledání. Některé indexery provádějí jazykově specifické úpravy, jako [[lemmatizace|lemmatizaci]] (nalezení [[kmen (mluvnice)|kmene]] slova) a [[derivace (lingvistika)|derivaci]] (nalezení odvozených tvarů, tj. [[skloňování]] nebo [[časování]]) napsala adrianka Ladicová.
 
== Přesnost versus zanedbávání ==