Verze z 13. 4. 2018, 09:59 editovat Jan Spousta (diskuse \| příspěvky) Prověření uživatelé 10 173 editací m Přesněji ← Přejít na předchozí porovnání		Verze z 13. 4. 2018, 10:24 editovat zrušit editaci Jan Spousta (diskuse \| příspěvky) Prověření uživatelé 10 173 editací m Varování značka: editace z Vizuálního editoru Přejít na další porovnání →
Řádek 3: * ''p''-hodnota je nejmenší hladina významnosti ([[infimum]] hodnot <math>\alpha</math>), při které ještě zamítneme <math>H_0</math>; * ''p''-hodnota je pravděpodobnost, že při platnosti <math>H_0</math> nabývá testová statistika <math>T</math> své stávající hodnoty anebo hodnot ještě extrémnějších (nepříznivějších vůči <math>H_0</math>). V praxi se ''p''-hodnota používá tak, že si předem stanovíme hladinu významnnosti <math>\alpha</math>, poté spočítáme pomocí statistického programu ''p''-hodnotu a porovnáme ji s <math>\alpha</math>. Vyjde-li ''p''-hodnota ''menší'' než <math>\alpha</math>, nulovou hypotézu <math>H_0</math> zamítneme, zatímco v opačném případě prohlásíme, že na základě zkoumaných dat ji s použitím daného testu zamítnout nelze. Čím menší tedy je ''p''-hodnota, tím se nulová hypotéza jeví za jinak stejných podmínek ~~nepravděpodobnější~~nevěrohodnější. Oproti klasickému postupu testování spojenému s vyhledáváním [[Kvantil\|kvantilů]] rozdělení <math>T</math> v tabulkách se s využitím ''p''-hodnot práce analytika značně zjednodušuje, neboť pro rozhodnutí o výsledku testu stačí porovnat dvě čísla. Oproti klasickému postupu testování spojenému s vyhledáváním [[Kvantil\|kvantilů]] rozdělení <math>T</math> v tabulkách se s využitím ''p''-hodnot práce analytika značně zjednodušuje, neboť pro rozhodnutí o výsledku testu stačí porovnat dvě čísla. Tato snadnost však někdy svádí k mechanickému přístupu, přehlížení dalších faktorů potřebných pro posouzení validity a smyslu testů nebo dokonce k vědomé či nevědomé metodologické nekorektnosti při výzkumu. Je potřeba mít na mysli zejména následující fakta: * Není pravda, že by ''p''-hodnota přímo vyjadřovala pravděpodobnost nulové hypotézy anebo pravděpodobnost, že alternativní hypotéza neplatí. * ''p''-hodnota není ani pravděpodobnost, že data vznikla čistě náhodou za předpokladu platnosti <math>H_0</math>. * ''p''-hodnota nic přímo nevypovídá o velikosti nebo praktické významnosti pozorovaného účinku (viz [[velikost účinku]]). * Hladina významnosti 0,05 je jen konvence, takže pro posouzení výsledků experimentu je potřeba dodat i další informace o kontextu a o dopadu zjištění * Pokud testujeme mnoho hypotéz zároveň, stane se i při platnosti nulové hypotézy, že některé testy vyjdou signifikantní - například při hladině 0,05 takto vyjde zhruba 5 testů ze 100 provedených při platnosti <math>H_0</math>. Pro správné posouzení takto prováděných testů je potřeba použít [[mnohonásobné testování]] (multiple testing). * Je neetické využívat mnohonásobné testování tak, že výzkumník tak dlouho provádí testy a modifikuje svá data, dokud nezíská p-hodnotu menší než 0,05, aniž by na uvedené manipulace upozornil ve svém výstupu (postup označovaný jako p-hacking). Podobné nekorektní postupy jsou jednou z příčin současné krize replikovatelnosti výzkumných výstupl v řadě disciplin. [[Kategorie: Matematická statistika]]

P-hodnota: Porovnání verzí