Shluková analýza: Porovnání verzí

Smazaný obsah Přidaný obsah
OndraVozar (diskuse | příspěvky)
OndraVozar (diskuse | příspěvky)
Řádek 26:
 
== Metody hierarchického shlukování ==
Existují různé způsobypřístupy, jak shlukovat objekty na základě jejich vzdálenosti či podobnosti. Mezi základní metody patří:
* ''metoda nejbližšího souseda'' (''single linkage'', ''nearest neighbor'') – vzdálenost shluků je určována vzdáleností dvou nejbližších objektů z různých shluků. Při použití této metody jsou objekty taženy k sobě, výsledkem jsou dlouhé řetězy.
* ''metoda nejvzdálenějšího souseda'' (''complete linkage'', ''furthest neighbor'') - vzdálenost shluků je určována naopak vzdáleností dvou nejvzdálenějších objektů z různých shluků. Funguje dobře především v případě, že objekty tvoří přirozeně oddělené shluky, nehodí se, pokud je tendence k řetězení.
* ''centroidní metoda'' - vzdálenost shluků je určována vzdáleností jejich center (hypotetická jednotka s průměrnými hodnotami znaků). Může být nevážená nebo vážená. Ta zohledňuje velikosti klastrůshluků a hodíje se,vhodná pokud očekáváme jejich rozdílnost. PožadujeUžívá se vyjádření vzdálenosti objektů čtvercovou euklidovskou vzdáleností.
* ''párová vzdálenost'' (pair-group average) - vzdálenost shluků je určována jako průměr vzdáleností všech párů objektů z různých shluků. Opět může být ve vážené i nevážené podobě.
* ''Wardova metoda'' - vychází z [[analýza rozptylu|analýzy rozptylu]]. VybíráSlučuje takové shluky ke sloučení, kde je minimální součet čtverců. Obecně lze říci, že je tato metoda velmi účinná, alenicméně má tendenci vytvářet poměrně malé shluky. PožadujeVzdálenosti vyjádřeníobjektů vzdálenostise objektůměří čtvercovou euklidovskou vzdáleností.
 
== Použitá literatura ==