Koeficient determinace

míra kvality regresního modelu

Koeficient determinace, běžně označovaný („R kvadrát“), je v matematické statistice míra kvality regresního modelu, která ve své základní podobě vyjadřuje, jaký podíl variability závisle proměnné model vysvětluje. Koeficient determinace může nabývat hodnoty maximálně 1 (nebo vyjádřeno v procentech 100 %), což znamená dokonalou predikci hodnot závisle proměnné. Naopak hodnota 0 (resp. 0 %) znamená, že model nepřináší pro poznání závisle proměnné žádnou informaci, je zcela neužitečný.

Graf dvou regresních přímek s vysokým a nižším koeficientem determinace

Koeficient determinace lineárního regresního modelu se obvykle definuje jako jedna minus podíl rozptylu chyb (tj. rozdílů mezi predikcemi modelu a skutečnými hodnotami nezávisle proměnné) a rozptylu nezávisle proměnné. To vede na definiční rovnici

,

kde je suma čtverců chyb (residuí), suma kvadratických odchylek závisle proměnné od její střední hodnoty a je regresní odhad -tého pozorování. Koeficient determinace má za těchto okolností zároveň význam čtverce Pearsonova korelačního koeficientu mezi pozorovanými a modelem odhadnutými hodnotami závisle proměnné.

Koeficient determinace má tendenci růst s počtem nezávisle proměnných v regresním modelu, i když tyto přidávané proměnné nenesou žádnou novou informaci o závisle proměnné. Aby se tomuto umělému nárůstu předešlo, navrhl Henri Theil adjustovaný koeficient determinace , který opravuje odhadovanou inflaci původního koeficientu determinace a počítá se podle vzorce

,

kde je počet pozorování v souboru a počet proměnných v modelu. může vyjít i menší než nula. Postupů pro adjustaci koeficientu determinace je nicméně velké množství, určených pro různé druhy zobecnění kvality predikce.[1][2]

Reference editovat

  1. YIN, Ping; FAN, Xitao. Estimating R2 Shrinkage in Multiple Regression: A Comparison of Different Analytical Methods. S. 203–224. The Journal of Experimental Education [online]. 2001-01. Roč. 69, čís. 2, s. 203–224. DOI 10.1080/00220970109600656. 
  2. SALH, Samira Muhamad. ESTIMATING R 2 SHRINKAGE IN REGRESSION. S. 1–6. International Journal of Technical Research and Applications [online]. 2015. Roč. 3, čís. 2, s. 1–6. Dostupné online. 

Externí odkazy editovat