Interval spolehlivosti: Porovnání verzí

Smazaný obsah Přidaný obsah
JAnDbot (diskuse | příspěvky)
m robot: přidáno {{Autoritní data}}; kosmetické úpravy
Řádek 1:
[[FileSoubor:Confidence intervall normal dist.svg|náhled|Intervaly spolehlivosti na hladině 95 % pro 100 výběrů o rozsahu 30 z normálně rozděleného souboru se střední hodnotou 5. Z nich 94 intervaly obsahují správnou střední hodnotu μ = 5, zatímco zbylých 6 intervalů nikoli.]]
'''Interval spolehlivosti''' neboli '''konfidenční interval''' je ve statistice typ [[Intervalový odhad|intervalového odhadu]] neznámého parametru. Pro jeho stanovení je potřeba předem určit '''konfidenční hladinu''' (nejčastěji se používá 95 %, což je doplněk běžně používané [[hladina spolehlivosti|hladiny spolehlivosti]] 5 % do sta procent). Konfidenční intervaly se poté stanovují tak, aby očekávaný podíl těch nezávisle stanovených intervalů, ve kterých se vyskytuje skutečná hodnota parametru, byl roven konfidenční hladině. V praxi se přitom využívá odhad [[Standardní chyba|standardní chyby]] sledovaného ukazatele.
 
Používáme-li konfidenční hladinu 95 %, znamená to, že změříme-li 100 nezávislých datových souborů, na nichž odhadujeme neznámý parametr intervalem spolehlivosti, tak zhruba 95 intervalů bude hledaný parametr obsahovat a zhruba pět nikoli (viz obrázek). To se někdy vyjadřuje zjednodušeným tvrzením, že „neznámý parametr leží v intervalu spolehlivosti s 95% pravděpodobností,“ což však není z hlediska klasické „frekventistické“ teorie pravděpodobnosti korektní, jelikož po stanovení intervalu spolehlivosti neznámý parametr buď v tomto intervalu leží, anebo neleží, nelze však hovořit o pravděpodobnosti u jevu, který již nastal nebo nenastal. Podobný výrok však lze použít u analogických [[Bayesovská statistika|bayesovských]] intervalových odhadů zvaných [[konfidenční oblast|konfidenční oblasti]]i, protože bayesovská subjektivní interpretace pravděpodobnosti připouští, abychom mluvili o pravděpodobnosti jevu, který už nastal, ale není nám přesně známo, co se stalo.
 
Koncept intervalových odhadů a intervalů spolehlivosti definoval [[Jerzy Neyman]] roku 1937.
Řádek 12:
P[θ<sup>1</sup>(X<sub>1</sub>,... , X<sub>n</sub>) ≤ θ ≤ θ<sup>2</sup>(X<sub>1</sub>,... , X<sub>n</sub>)] ≥ 1 - α<br />
 
Dvojice statistik (θ<sup>1</sup>,θ<sup>2</sup>)splňující tento vztah 100 . (1 - α)% se nazývá interval spolehlivosti.
Statistika θ<sup>1</sup>(X<sub>1</sub>,...,X<sub>n</sub>) se nazývá '''dolní mez''' a statistika θ<sup>2</sup>(X<sup>1</sup>,...,X<sub>n</sub>) '''horní mez intervalu spolehlivosti'''. Číslo α se nazývá koeficient spolehlivosti (nejčastěji tento koeficient nabývá hodnoty α = 0,05, α = 0,01, tzn. 95% interval spolehlivosti, resp. interval spolehlivosti 99%.<br />
 
Řádek 19:
a hovoříme o dolním,resp. horním intervalovém odhadu nebo obecně o '''jednostranných intervalech spolehlivosti'''.
 
== Příklad: Použití v epidemiologii ==
Všechna data v [[epidemiologie|epidemiologii]] ([[veterinární epidemiologie]]) mají tři položky: CI, M, SD (interval spolehlivosti, průměrnou hodnotu, odchylku od průměru).
 
Velká (populační) epidemiologie vychází z [[centrální limitní věta|centrální limitní věty]] a vychází z [[Normální rozdělení|normálního rozdělení]], jelikož ve velké populaci platí zákony velkých čísel.
 
Nejvíce jedinců je uprostřed grafu, nejméně na jeho okraji. Střed grafu má hodnotu označenou jako M (mean), což je součet všech hodnot vydělený jejich počtem (aritmetický průměr).
 
* Jedna střední odchylka průměru (SD – Standard Deviation, směrodatná odchylka) zachycuje 68,2 % populace. To znamená, že interval spolehlivosti je 68,2 % (CI=68,2)
Řádek 54:
|}
 
Většinou se za nízkou jistotu, že se nemoc v populaci nevyskytuje (populace je zdravá), považuje pravděpodobnost 90 % či 95 %. Za velice dobrou hladinu jistoty, že se nemoc v populaci nevyskytuje, se považuje 99 % a více.
 
CI nám udává, pro jak velké procento populace výsledek platí. Nikdy nemůže platit pro celou populaci, vždy se najdou jedinci, kteří jsou průměru hodně daleko. Jinými slovy CI nikdy nemůže být 100 % (jen limitou sta procent).
Řádek 60:
Epidemiologové pracují i s malými populacemi. Princip, na kterém tyto výpočty stojí, se jmenuje ''T&nbsp;– distribuce neboli Studentova distribuce''. Slovo „Student“ se používá na počest [[William Sealy Gosset|Williama Seallyho Gosseta]], který se pod své práce podepisoval jako „student“, popsal poprvé [[T-test]]. Čím více dat je k dispozici, tím více se bude T–distribuce podobat průměrné (Gaussově) distribuci. Podstata obou přístupů je stejná, rozdíly ve výsledcích jsou zanedbatelné.
 
== Související články ==
* [[Kauzalita (epidemiologie)]]
* [[Bias (epidemiologie)]]
Řádek 76:
* [https://web.archive.org/web/20170809101742/http://www.cnstn.rnrt.tn/afra-ict/ICT%20TOOLS%20RAF0026/PESTE%20BOVINE/References/1006.pdf Dirk Pfeiffer - veterinární epidemiologie]
* [http://%5Bhttp://apps.who.int/iris/bitstream/handle/10665/43541/9241547073_eng.pdf;jsessionid=108FF08F2503A284BB43FEA608055AF2?sequence=1%5D Základy epidemiologie - Světová zdravotnická organizace|WHO 2006, druhé vydání] {{Wayback|url=http://%5bhttp/ |date=20110519173408 }}
{{Autoritní data}}
 
[[Kategorie:Epidemiologie]]