Chí-kvadrát test: Porovnání verzí

Smazaný obsah Přidaný obsah
značky: editace z mobilu editace z mobilního webu
Bez shrnutí editace
Řádek 16:
* [[Test nezávislosti]] dvou diskrétních znaků. Vychází se z [[Kontingenční tabulka|kontingenční tabulky]] těchto znaků, tedy obdélníkové nebo čtvercové tabulky četností jednotlivých kombinací výskytu hodnot znaků. Nulová hypotéza říká, že obě veličiny jsou na sobě statisticky nezávislé. Příklad může být test na datech sociologického výzkumu, kdy nás zajímá, zda [[Kraje v Česku|kraj]] respondenta (14 možností) souvisí s tím, zda volí pravici, levici nebo nepřijde k volbám vůbec (3 možnosti). Počet stupňů volnosti je součin rozměrů tabulky zmenšených o jednu, tedy zde (14 – 1) . (3 – 1) = 26.
* [[Test homogenity]] porovnává rozložení diskrétních veličin v dvou nebo více populacích a testuje, zda se toto rozložení populaci od populace neliší. Příkladem může být zkoumání vztahu pohlaví a rodinného stavu v rámci populací definovaných regiony Česka.
 
=== Chí-kvadrát test nezávislosti (χ<sup>2</sup> test) v epidemiologii ===
Chí-kvadrát test nezávislosti (chi-square test, χ<sup>2</sup> statistic) počítá asociaci mezi dvěma jevy. Jeden jev může být epidemiologické riziko, druhý nemoc. Jedním může být lék, druhým jeho účinnost. Zda je spojitost mezi příčinou a následkem statisticky průkazná, odhalí test.
 
'''Nulová hypotéza''' (null hypthesis) předpokládá, že není žádná spojitost dvěma jevy (mezi rizikem a nemocí). Chí-kvadrát test nezávislosti počítá chybu nulové hypotézy. Čím je chyba větší, tím méně je pravděpodobná nulová hypotéza, tím více platí opak.
 
'''Alternativní hypotéza''' je pravý opak nulové hypotézy (existuje spojitost mezi rizikem a nemocí). U epidemiologických studií tedy potvrzujeme alternativní hypotézu, spojitost mezi příčinou a následkem musí platit, jinak byla studie od počátku koncipována chybně. Jinými slovy chí-kvadrát test musí vyjít významně (hodnota musí být dostatečně vysoká).
 
Na výpočet existují statistické kalkulátory, přesto je třeba znát princip a hlavně interpretaci testu.
 
Epidemiologická tabulka 2x2 pro výpočet spojitosti mezi příčinou a následkem (hodnota rizikového faktoru) počítá pro každou buňku v tabulce chybu. Součtem všech čtyř chyb získáme výslednou hodnotu chí-kvadrát testu.
 
Test předpokládá, že není žádná spojitost mezi řádky a sloupci!
 
χ2 = ∑ i (Oi −Ei)<sup>2</sup>/Ei
 
'''E''' (expectation) očekávaná hodnota v buňce tabulky (součet řádků lomeno celkovým počtem v poměru k součtu sloupců)
 
'''O''' (observed) pozorovaná hodnota (naměřené číslo v buňce tabulky)
 
'''r''' (rows) počet buněk v řádcích tabulky (vodorovně)
 
'''c''' (columns) počet buněk ve sloupcích tabulky (svisle)
 
Stupeň volnosti (degree of freedom) DF:  '''DF=(r-1)*(c-1)'''
 
''<u>Tabulka 2x2 pro chí kvadrát test</u>''
{| class="wikitable"
|
|Nemocní (+)
|Zdraví (-)
|Celkem
|-
|v riziku (+)
|a           37
 
50/120 x 54 = 22.5
 
(a+b/n) * (a+c)
|b           13
 
50/120 x 66 = 27.5
 
(a+b/n) *(b+d)
|a+b     50
|-
|bez rizika (-)
|c            17
 
70/120 x 54 = 31.5
 
(c+d/n) * (a+c)
|d             53
 
70/120 x 66 = 38.5
 
(c+d/n) *(b+d)
|c+d      70
|-
|Celkem
|a+c          54
|b+d       66
|n         120
|}
 
 
[(37-22,5)<sup>2</sup>/ 22,5] + [(13-27,5)<sup>2</sup>/ 27,5] + [(17-31,5)<sup>2</sup>/ 31,5] + [(53-38,5)<sup>2</sup>/ 38,5] = =29,1
 
χ<sup>2</sup> = 29,1 se stupněm volnosti 1.
 
Ke stejnému výsledku dojdeme podle vzorce:
 
χ'''<sup>2</sup> = [n(ad–bc)<sup>2</sup> ] / [ (a+c)(b+d)(a+b)(c+d) ]'''
 
Hodnotu chí-kvadrát testu lze převést na pravděpodobnost. Slouží k tomu kalkulátory (p-value calculator) nebo tabulka distribuce chí kvadrátu.
 
Čím je hodnota chí-kvadrát testu větší, tím je pravděpodobnost nulové hypotézy (p-value) menší.
 
Při použití kalkulátoru zadáme hodnoty testu a stupně volnosti, získáme '''pravděpodobnost, s jakou nulová hypotéza platí (p-value)'''.
[[Soubor:Chí kvadrát tabulka.png|náhled|Distribuce Chí kvadrátu pro epidemiologickou tabulku 2x2]]
Pro námi vypočítanou hodnotu chí-kvadrát testu 29,1 a stupeň volnosti 1DF (degree of freedom) je pravděpodobnost nulové hypotézy (p-value) menší než 0,0001. To je velice nízká p-value, tedy platí alternativní hypotéza. Námi změřené hodnoty potvrzují spojitost mezi rizikem a nemocí (chí-kvadrát test vyšel).
 
'''Kritická hodnota''' je hraniční číslo, které dělí výsledky testu. Pravděpodobnost větší než kritická hodnota potvrzuje nulovou hypotézu,
 
p-value menší než kritická hodnota potvrzuje alternativní hypotézu.
 
Obecně je za kritickou hodnotu pro dva nezávislé jevy považována pravděpodobnost jedno promile '''(p-value=0,001).'''
 
U epidemiologických studií se žádá větší jistota, kritická hodnota byla přeměněna na '''hladinu významnosti 0,05 (5%)'''. To odpovídá CI=95% ( [[Interval spolehlivosti]] ='''CI'''; Conficence interval), tedy pravděpodobnosti 95%, že výsledek platí.
 
Pokud je pravděpodobnost '''p-value<0,05''', pak existuje spojitost mezi epidemiologickým rizikem a nemocí. Chí-kvadrát test nezávislosti potvrdil alternativní hypotézu. Epidemiologové řeknou, že '''test vyšel.'''
 
Naopak pokud je '''p-value>0,05,''' pak není žádná spojitost mezi rizikem a nemocí (posuzované riziko není rizikem, nemá na nemoc vliv). Chí-kvadrát test nezávislosti potvrdil nulovou hypotézu. Epidemiologové řeknou, že '''test nevyšel'''.
 
Chí kvadrát test nezávislosti musí potvrdit asociaci mezi příčinou a následkem u každé studie.
 
Pokud test nevyjde, pak byla epidemiologická studie od počátku směřována chybně. U testování léků to znamená, že neléčí ani neškodí, nemají na nemoc vůbec žádný vliv. Tento výsledek získáme například u testování homeopatik (nejsou to léky).
 
== Související články ==
* [[Incidence]]
* [[validita laboratorního testu]]
* [[kauzalita (epidemiologie)]]
* [[bias (epidemiologie)]]
* [[kohortové studie]]
* [[studie případů]]
* [[LR nomogram]]
* [[Interval spolehlivosti (epidemiologie)]]
* [[Vzorkování populace (epidemiologie)]]
 
==Reference==