Korelace: Porovnání verzí

Smazaný obsah Přidaný obsah
→‎Výpočet Pearsonova korelačního koeficientu: Ve slovním popisu vzorce byl nahrazen logicky chybný termín "násobek" správným termínem "součin".
OndraVozar (diskuse | příspěvky)
→‎Výpočet Pearsonova korelačního koeficientu: vypustil jsem zbytečný popis výpočtu, přidal podmínky
Řádek 8:
Vztah mezi znaky či veličinami ''x'' a ''y'' může být kladný, pokud (přibližně) platí ''y'' = ''kx'', nebo záporný (''y'' = -''kx''). Hodnota korelačního koeficientu −1 značí zcela nepřímou závislost (antikorelaci), tedy čím více se zvětší hodnoty v první skupině znaků, tím více se zmenší hodnoty v druhé skupině znaků, např. vztah mezi uplynulým a zbývajícím časem. Hodnota korelačního koeficientu +1 značí zcela přímou závislost, např. vztah mezi rychlostí bicyklu a frekvencí otáček kola bicyklu. Pokud je korelační koeficient roven 0 (nekorelovanost), pak mezi znaky není žádná statisticky zjistitelná lineární závislost. Je dobré si uvědomit, že i při nulovém korelačním koeficientu na sobě veličiny mohou záviset, pouze tento vztah nelze vyjádřit lineární funkcí, a to ani přibližně.
 
=== VýpočetVzorec Pearsonova korelačního koeficientu ===
Pearsonův korelační koeficient je definován, pokud jsou druhé momenty náhodných veličin X a Y <math>E(X^2),E(Y^2)</math> konečné. Je založen na myšlence, že [[Kovariance|kovarianci]] převádeme na bezrozměné číslo, že ji podělíme směrodatnými odchylkami obou proměnných:
Vypočteme [[Aritmetický průměr|aritmetické průměry]] proměnných X a Y (E(X) a E(Y)), vypočteme střední hodnotu součinu odchylek od těchto průměrů. Tím jsme spočetli tzv. [[Kovariance|kovarianci]], což je však absolutní veličina, pro výpočet relativní veličiny pak kovarianci dělíme součinem odmocnin [[Rozptyl (statistika)|rozptylů]] proměnných X a Y.
 
:<math>\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y},</math>
 
Protože <math> \mu_X = E(X) </math>, <math>\sigma^2_X = E(X^2) - E^2(X)</math> a obdobně pro ''Y'', můžemelze psátvýše uvedený vzorec upravit do přehlednějšího výpočetního tvaru:
 
:<math>\rho_{X,Y}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}~\sqrt{E(Y^2)-E^2(Y)}}</math>
 
Koeficient korelace nabývá hodnot z intervalu <math>\langle -1,1\rangle</math>. Při nezávislosti veličin <math>X</math> a <math>Y</math> je koeficient korelace roven 0. Nulový korelační koeficient však neznamená, že jsou veličiny <math>X</math> a <math>Y</math> nezávislé. Nulový korelační koeficient má například dvojice náhodných veličin <math>X</math> a <math>Y=X^2</math>.
 
Tento koeficient jako první odvodil anglický psycholog a antropolog Sir [[Francis Galton]].