Korelace

vzájemný vztah mezi dvěma náhodnými procesy nebo náhodnými veličinami

Korelace (z lat. souvztažnost) znamená vzájemný vztah mezi dvěma náhodnými procesy nebo náhodnými veličinami. Pokud se jedna z náhodných veličin mění, mění se i druhá a naopak. Pokud se mezi dvěma náhodnými procesy identifikuje korelace, je pravděpodobné, že na sobě závisejí. Z korelovanosti náhodných procesů nebo náhodných veličin však nelze usuzovat na příčinný vztah. Tedy jeden z nich nemusí být příčinou a druhý následkem. Toto samotná korelace nedovoluje rozhodnout, jelikož korelace neimplikuje kauzalitu a ani směr kauzality.[1][2]

Ve statistice se pojem korelace užívá pro vyjádření lineárního vztahu mezi náhodnými veličinami X a Y. Sílu korelace pak vyjadřuje korelační koeficient, který nabývá hodnoty −1 až +1.[2][3]

Korelace ve statistice

editovat
 
Na obrázku je několik příkladů grafického zobrazení dat a koeficienty jejich korelace s funkcí y = x

Vztah mezi znaky či náhodnými veličinami X a Y může být kladný, pokud (přibližně) platí Y = kX, nebo záporný (Y = -kX). Hodnota korelačního koeficientu −1 značí zcela nepřímou závislost (antikorelaci), tedy čím více se zvětší hodnoty v první skupině znaků, tím více se zmenší hodnoty v druhé skupině znaků, např. vztah mezi uplynulým a zbývajícím časem. Hodnota korelačního koeficientu +1 značí zcela přímou závislost, např. vztah mezi rychlostí bicyklu a frekvencí otáček kola bicyklu. Pokud je korelační koeficient roven 0 (nekorelovanost), pak mezi znaky není žádná statisticky zjistitelná lineární závislost. Je dobré si uvědomit, že i při nulovém korelačním koeficientu na sobě veličiny mohou záviset, pouze tento vztah nelze vyjádřit lineární funkcí (např.  ), a to ani přibližně.[2][3]

Pearsonův korelační koeficient

editovat

Pearsonův korelační koeficient je definován, pokud jsou druhé mocniny náhodných veličin X a Y   konečné a jejich rozptyly nenulové. Vypočte se normováním kovariance tak, že ji podělíme směrodatnými odchylkami obou proměnných na bezrozměrné číslo nabývající hodnoty -1 až 1:

 

Jelikož  ,   a obdobně pro Y, lze výše uvedený vzorec upravit do přehlednějšího výpočetního tvaru:

 

Korelační koeficient nabývá hodnot z intervalu  . Při nezávislosti náhodných veličin   a   je korelační koeficient roven 0. Nulový korelační koeficient však neznamená, že jsou náhodné veličiny   a   nezávislé. Nulový korelační koeficient má například dvojice náhodných veličin   a  .

Tuto míru asociace jako první odvodil anglický psycholog a antropolog sir Francis Galton.

Existují nicméně i jiné koeficienty asociace, například Spearmanovo rhó či Kendallovo tau pro ordinální (pořadová) data.

Korelace v teorii signálů

editovat
Související informace naleznete také v článku korelace (zpracování signálu).

Zkrácený výraz pro korelační funkci.

Pro spojité signály   a  :

 

Pro diskrétní signály   a  :

 

U komplexních signálů   představuje komplexně sdružené číslo k  .

Velmi se podobá konvoluci. Rozdíl je hlavně v časovém překlopení druhé funkce  .

Autokorelací se rozumí korelace  . Lze tak určit tzv. soběpodobnost signálu, tedy zda se např. signál v určitých periodách opakuje.

Související články

editovat

Externí odkazy

editovat

Reference

editovat
  1. 13 - Korelace (MAT - Statistika). [s.l.]: [s.n.] Dostupné online. 
  2. a b c Co je to korelace a kauzalita? - Vědecké kladivo AK 14. [s.l.]: [s.n.] Dostupné online. 
  3. a b Korelace – co to je korelace a co znamená korelační koeficient [online]. 2021-01-03 [cit. 2023-06-09]. Dostupné online.