F-test: Porovnání verzí

Smazaný obsah Přidaný obsah
→‎Reference: překlep, port
značky: editace z mobilu editace z mobilního webu
m Robot: -nevhodná url; kosmetické úpravy
Řádek 1:
'''''F-''test''' je jakýkoliv [[Testování statistických hypotéz|statistický test]], ve kterém má testová statistika [[Rozdělení F|rozdělení ''F'']] za předpokladu platnosti nulové hypotézy. Nejčastěji se používá při porovnávání statistických modelů, které byly odhadnuty na základě [[Data|datového]] souboru, za účelem identifikace modelu, který nejlépe odpovídá populaci, ze které byla data vybrána. Exaktní ''F-''testy vznikají zejména v případě, že modely byly odhadovány za použití metody [[Metoda nejmenších čtverců|nejmenších čtverců]]. Název ''F-''test razil George W. Snedecor na počest [[Ronald Fisher|Ronalda A. Fishera]]. Fisher ''F''-statistiku vyvinul jako poměr rozptylů ve 20. letech 20. století.<ref>{{Citace monografie
| vydání = 3rd ed
| titul = Statistical concepts : a second course
| urloclc = https://www.worldcat.org/oclc/150257419
| vydavatel = Lawrence Erlbaum Associates
| místo = Mahwah, N.J.
Řádek 8:
| isbn2 = 0805858504
| počet stran = 266 pages
| oclc = 150257419
| jméno = Lomax, Richard
| příjmení = G.
}}</ref>
 
== Běžné použití ==
Mezi běžné příklady použití ''F-''testů patří následující případy:
* Hypotéza, že se sobě rovnají střední hodnoty dané množiny [[Normální rozdělení|normálně rozdělených]] populací, všech se stejnou [[Směrodatná odchylka|směrodatnou odchylkou]]. To je asi nejznámější ''F-'' test a hraje důležitou roli v [[Analýza rozptylu|analýze rozptylu]] (ANOVA).
* Hypotéza, že navrhovaný regresní model dobře odpovídá [[Data|datům]].
* Hypotéza, že data v [[Regresní analýza|regresní analýze]] vyhovují jednoduššímu ze dvou navrhovaných lineárních modelech, který je vnořený do složitějšího.
* Další použití ''F''-testu se týká testování rovnosti rozptylů daného ukazatele ve dvou různých populacích. Test je citlivý na odchylky od [[Normální rozdělení|normálního rozdělení]] ukazatele. <ref>{{cite journal|last=Box|first=G. E. P.|authorlink=Tristan E. P. Box|journal=Biometrika|year=1953|title=Non-Normality and Tests on Variances|pages=318–335|volume=40|jstor=2333350|issue=3/4|doi=10.1093/biomet/40.3-4.318}}</ref> <ref>{{cite journal|last=Markowski|first=Carol A|author2=Markowski, Edward P.|year=1990|title=Conditions for the Effectiveness of a Preliminary Test of Variance|journal=[[The American Statistician]]|pages=322–326|volume=44|jstor=2684360|doi=10.2307/2684360|issue=4}}</ref> V [[Analýza rozptylu|analýze rozptylu]] (ANOVA) se jako alternativní testy používají Leveneův test , Bartlettův test a Brownův-Forsytheův test. Nicméně aplikace kteréhokoli z těchto testů za účelem testování předpokladu [[Homoskedasticita|homoskedasticity]] (tj. stejnosti rozptylu ve skupinách) jako předběžného kroku před testováním středních hodnot efektů vede ke zvýšení podílu [[Chyby typu I a II|chyb 1. typu]].<ref>{{cite journal|last=Sawilowsky|first=S.|year=2002|title=Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable Difference Between Two Means When σ<sub>1</sub><sup>2</sup> ≠ σ<sub>2</sub><sup>2</sup>|journal=Journal of Modern Applied Statistical Methods|volume=1|issue=2|pages=461–472|doi=|url=http://digitalcommons.wayne.edu/jmasm/vol1/iss2/55|access-date=2015-03-30|archive-url=https://web.archive.org/web/20150403095901/http://digitalcommons.wayne.edu/jmasm/vol1/iss2/55/|archive-date=2015-04-03|dead-url=no|df=}}</ref>
 
Některé další statistické postupy, jako je Schefféova metoda pro mnohonásobná srovnání v lineárních modelech, také používají ''F''-testy.
 
== Výpočet ==
Většina ''F-''testů vzniká na základě rozkladu [[Rozptyl (statistika)|rozptylu]] jakožto součtu čtverců odchylek od střední hodnoty. Testová statistika je poměrem dvou členů úměrných součtům čtverců odrážejících různé zdroje variability. Tyto součty čtverců jsou utvořeny tak, aby statistika měla tendenci být vyšší, pokud nulová hypotéza není pravdivá. Aby statistika mohla mít rozdělení ''F'' za předpokladu nulové hypotézy, musejí být oba součty čtverců statisticky nezávislé a každý by měl mít vhodně škálované [[Rozdělení chí kvadrát|rozdělení χ²]]. Posledně uvedená podmínka je zaručena, pokud jsou hodnoty analyzované veličiny vzájemně nezávislé a [[Normální rozdělení|normálně distribuované]] se stejným [[Rozptyl (statistika)|rozptylem]].
 
== Reference ==