Fulltextové vyhledávání: Porovnání verzí

Smazaný obsah Přidaný obsah
Smuto (diskuse | příspěvky)
mBez shrnutí editace
Smuto (diskuse | příspěvky)
mBez shrnutí editace
Řádek 23:
 
== Zlepšení výkonů full-textového vyhledávání ==
Nedostatky volného hledání je možné eliminovat dvojím způsobem: umožnit uživatelům s nástrojem vyjádřit jejich dotaz přesněji, a vyvinoutvyvynout nový vyhledávací algorytmusalgoritmus zlepšující vyhledávací přesnost.
 
=== Vylepšování dotazovacími nástroji ===
Řádek 29:
* Hledání v polích - popis jsou vytříděny do specifických polí, např. pole "Autor", nebo "Datum vložení",... umožní vyhledávat text pouze ve vyhrazených polích.
* [[Booleova logika|Booleove]] dotazy - používání operátorů (například "encyklopédia" AND "online" NOT "Encarta") může dramaticky zpřesnit vyhledávání, Například AND operátor říká "nepatří sem žádný z dokumentů který neobsahuje současně obě slova". Operátor AND tedy zužuje výběr, zatímco OR rozšiřuje. Zlepšení přesnosti vyhledání je velmi často kontraproduktivní, a často vede k snížení vytěžitelnosti. <ref> Studie opakovaně ukazují, že mnoho uživatelů nerozumí formulaci negativních dotazů[http://eprints.cs.vt.edu/archive/00000112/]</ref>
* Vyhledávání frází - nachází doskumenty, obsahující přesnou frázi (sled písmen), například "WikipedieWikipedia, otevřená encyklopedie"
* Konkordance - vyhledávání produkuje abecední seznam všech nejdůležitějších slov nacházejících se v aktuálním kontextu
* Blízkostní vyhledávání - hledá se fráze z dvou či více slov, které jsou od sebe vzdálené o specifikovaný počet slov. Například hledání "Wikipedia" WITHIN2 "otevřená" najde pouze ty dokumenty, ve kterých je slovovýskyt slova "Wikipedia" maximálně dvě slova od "freeotevřená" occur within two words of each other.
* [[Regulární výraz]] - nabízí sice komplikované, ale velice silné definování dotazu
* Žolík - hledání nahrazuje jeden nebo více znaků ve vyhledávacím dotazu, například v [[Microsoft Word]], použití hvězdičky "*" v dotazu "s*d" nalezne "sud", "sad",atd. v textu
 
<!--
 
* [[Proximity search]]. A phrase search matches only those documents that contain two or more words that are separated by a specified number of words;
* [[Regular expression]]. A regular expression employs a complex but powerful querying [[syntax]] that can be used to specify retrieval conditions with precision.
* [[Wildcard character|Wildcard search]]. A search that substitutes one or more characters in a search query for a wildcard character such as an [[asterisk]]. For example, in the search function in [[Microsoft Word]], using the asterisk in the search query "s*n" will find "sin", "son", "sun", etc. in a text.
 
===Improved search algorithms===