Distribuční sémantika

Distribuční sémantika je podoblastí zpracování přirozeného jazyka, která se snaží o pochopení významů slovních spojení.[1]

Jak spolu slova v daném jazyce souvisejí je demonstrováno v "sémantickém prostoru", který matematicky odpovídá vektorovému prostoru.

Studuje teorie a metody kvantifikace a kategorizace sémantických podobností mezi jazykovými položkami na základě jejich distribučních vlastností ve velkých vzorcích jazykových dat.

Distribuční hypotéza editovat

Základní myšlenku distribuční sémantiky lze shrnout do tzv. distribuční hypotézy: jazykové položky s podobnou distribucí mají podobné významy. Zjednodušeně: slova, která se používají a vyskytují ve stejných kontextech, mají tendenci mít podobný význam.[2]

Reference editovat

V tomto článku byl použit překlad textu z článku Distributional semantics na anglické Wikipedii.

  1. Distributional semantics: a light introduction. Aurelie Herbelot [online]. [cit. 2023-08-23]. Dostupné online. (anglicky) 
  2. HARRIS, Zellig S. Distributional Structure. WORD. 1954-08, roč. 10, čís. 2–3, s. 146–162. Dostupné online [cit. 2023-08-23]. ISSN 0043-7956. DOI 10.1080/00437956.1954.11659520. (anglicky)