P-hodnota: Porovnání verzí

Smazaný obsah Přidaný obsah
m Přesněji
m Varování
Řádek 3:
* ''p''-hodnota je nejmenší hladina významnosti ([[infimum]] hodnot <math>\alpha</math>), při které ještě zamítneme <math>H_0</math>;
* ''p''-hodnota je pravděpodobnost, že při platnosti <math>H_0</math> nabývá testová statistika <math>T</math> své stávající hodnoty anebo hodnot ještě extrémnějších (nepříznivějších vůči <math>H_0</math>).
 
V praxi se ''p''-hodnota používá tak, že si předem stanovíme hladinu významnnosti <math>\alpha</math>, poté spočítáme pomocí statistického programu ''p''-hodnotu a porovnáme ji s <math>\alpha</math>. Vyjde-li ''p''-hodnota ''menší'' než <math>\alpha</math>, nulovou hypotézu <math>H_0</math> zamítneme, zatímco v opačném případě prohlásíme, že na základě zkoumaných dat ji s použitím daného testu zamítnout nelze. Čím menší tedy je ''p''-hodnota, tím se nulová hypotéza jeví za jinak stejných podmínek nepravděpodobnějšínevěrohodnější. Oproti klasickému postupu testování spojenému s vyhledáváním [[Kvantil|kvantilů]] rozdělení <math>T</math> v tabulkách se s využitím ''p''-hodnot práce analytika značně zjednodušuje, neboť pro rozhodnutí o výsledku testu stačí porovnat dvě čísla.
 
Oproti klasickému postupu testování spojenému s vyhledáváním [[Kvantil|kvantilů]] rozdělení <math>T</math> v tabulkách se s využitím ''p''-hodnot práce analytika značně zjednodušuje, neboť pro rozhodnutí o výsledku testu stačí porovnat dvě čísla. Tato snadnost však někdy svádí k mechanickému přístupu, přehlížení dalších faktorů potřebných pro posouzení validity a smyslu testů nebo dokonce k vědomé či nevědomé metodologické nekorektnosti při výzkumu. Je potřeba mít na mysli zejména následující fakta:
 
* Není pravda, že by ''p''-hodnota přímo vyjadřovala pravděpodobnost nulové hypotézy anebo pravděpodobnost, že alternativní hypotéza neplatí.
* ''p''-hodnota není ani pravděpodobnost, že data vznikla čistě náhodou za předpokladu platnosti <math>H_0</math>.
* ''p''-hodnota nic přímo nevypovídá o velikosti nebo praktické významnosti pozorovaného účinku (viz [[velikost účinku]]).
* Hladina významnosti 0,05 je jen konvence, takže pro posouzení výsledků experimentu je potřeba dodat i další informace o kontextu a o dopadu zjištění
* Pokud testujeme mnoho hypotéz zároveň, stane se i při platnosti nulové hypotézy, že některé testy vyjdou signifikantní - například při hladině 0,05 takto vyjde zhruba 5 testů ze 100 provedených při platnosti <math>H_0</math>. Pro správné posouzení takto prováděných testů je potřeba použít [[mnohonásobné testování]] (multiple testing).
* Je neetické využívat mnohonásobné testování tak, že výzkumník tak dlouho provádí testy a modifikuje svá data, dokud nezíská p-hodnotu menší než 0,05, aniž by na uvedené manipulace upozornil ve svém výstupu (postup označovaný jako p-hacking). Podobné nekorektní postupy jsou jednou z příčin současné krize replikovatelnosti výzkumných výstupl v řadě disciplin.
 
[[Kategorie: Matematická statistika]]