Verze z 2. 2. 2016, 20:46 editovat Jvs (diskuse \| příspěvky) Prověření uživatelé, Správci 83 482 editací + Kategorie:Statistika ← Přejít na předchozí porovnání		Verze z 28. 2. 2019, 13:37 editovat zrušit editaci JAnDbot (diskuse \| příspěvky) Roboti 1 711 526 editací m Robot: přidáno {{Autoritní data}}; kosmetické úpravy Přejít na další porovnání →
Řádek 1: '''Výběrový soubor''' se používá ve statistickém, [[Sociologický výzkum\|sociologickém]] či [[Marketingový výzkum\|marketingovém výzkumu]] v okamžiku, kdy chceme na základě sledování náhodně vybraného vzorku (právě výběrového souboru) usuzovat závěry o celé populaci ([[Základní soubor\|základním souboru]]). Výběrový soubor je ten soubor, pro který získáváme při výzkumu data. Výběrový soubor je [[Podmnožina\|podmnožinou]] základního souboru, který například sleduje určitou populaci v určeném časovém úseku. Výběrový soubor již nezahrnuje celou populaci, ale jen její část. Tato část by však měla být [[Reprezentativita\|reprezentativní]], tedy odpovídat dané populaci.<ref name=":1">{{Citace monografie\|příjmení = Hendl\|jméno = Jan\|příjmení2 = \|jméno2 = \|titul = Přehled statistických metod: analýza a metaanalýza dat\|vydání = 2\|vydavatel = Portál\|místo = Praha\|rok = 2006\|počet stran = 583\|strany = 38-39\|isbn = 80-7367-123-9}}</ref> Pokud jsou například naším základním souborem všichni posluchači nějaké konkrétní rozhlasové stanice, nesmíme opomenout zařadit do výběru jedince různého věku, muže i ženy, obyvatele všech krajů ČR, apod. Omezením výběrového souboru například pouze na jeden kraj ČR by mohlo dojít ke zkreslení výsledků, protože v daném kraji mohou mít posluchači jiné preference, než v ostatních krajích. Pro snížení zkreslení vzorku je vhodné volit variantu výběru náhodných vzorků. Jinými slovy, kdybychom testovali úspěšnost studentů na vysokých školách, museli bychom vybrat vzorky po celé zemi, aniž bychom se jakkoliv limitovali či vzorek specifikovali, přičemž klademe důraz na to, abychom vybírali nahodile, což omezuje právě zkreslení výsledků.<ref>{{Citace monografie\|příjmení = Walker\|jméno = Ian\|příjmení2 = \|jméno2 = \|titul = Výzkumné metody a statistika\|vydání = \|vydavatel = Grada\|místo = Praha\|rok = 2012\|počet stran = 224\|strany = 32\|isbn = 978-80-247-3920-5}}</ref> Výběrový soubor má vždy konkrétní počet jednotek (prvků). Počet prvků „n“ se nazývá rozsah výběru. V praxi je často nezbytné provádět výzkum na menším vzorku, nežli je [[základní soubor]]. Zahrnutí všech jednotek může být obtížné z různých příčin: nemáme dostatečné finanční prostředky, dostatek času, brání nám etické důvody, nebo není možné všechny jednotky dohledat či kontaktovat. Abychom mohli výsledky získané pomocí výběrového souboru zobecnit na naši [[Cílová populace\|cílovou populaci]], je třeba volit jednotlivé prvky náhodně: všechny potenciální jednotky výběrového souboru musí mít stejnou šanci, abychom je do výzkumu zahrnuli <ref name=":1" />. == Statistické usuzování == Statistické usuzování neboli [[Logická indukce\|indukce]], je proces zobecňování z výběrového souboru (n) na celý soubor, resp. populaci (N). Cílem induktivní statistiky je z vypozorovaných dat vyvodit zobecnitelná tvrzení s udáním [[Interval spolehlivosti\|intervalu spolehlivosti]] - jde tedy o snahu objektivizovat pozorování a zbavit se subjektivního vlivu pozorovatele. Při dodržení správného postupu lze pomocí náhodného výběru dělat závěry o celém souboru.<ref>{{Citace monografie\|příjmení = HINDLS\|jméno = Richard\|příjmení2 = HRONOVÁ\|jméno2 = Stanislava\|titul = Statistika pro ekonomy\|vydání = 7\|vydavatel = Professional Publ.\|místo = Praha\|rok = 2006\|počet stran = 415\|strany = 108\|isbn = 80-86946-16-9\|jméno3 = Jan\|příjmení3 = SEGER}}</ref> Náhodný výběr má za cíl dosáhnout maximální [[Reprezentativita\|reprezentativnosti]] výzkumu. To znamená, aby výběr obsahoval celou strukturu zkoumaného souboru. Náhodný výběr musí splňovat dvě základní podmínky: pravděpodobnost výběru je pro všechny jednotky souboru nenulová a zároveň jsou jednotky vybrány nezávisle jedna na druhé.<ref>{{Citace monografie\|příjmení = HINDLS\|jméno = Richard\|příjmení2 = HRONOVÁ\|jméno2 = Stanislava; SEGER, Jan\|titul = Statistika pro ekonomy\|vydání = 7\|vydavatel = Professional Publ.\|místo = Praha\|rok = 2006\|počet stran = 415\|strany = 110\|isbn = 80-86946-16-9}}</ref> == Chyby odhadů == K chybám v odhadech výběrové statistiky aktuálního parametru dané populace nebo jen určité subpopulace může dojít buď v důsledku výběru, kde řadíme [[Náhodná chyba\|chyby výběrové náhodné]] a [[Systematická chyba\|chyby výběrové systematické]]. Chyby výběrové náhodné jsou zapříčiněné působením náhody při výběru vzorku populace.<ref name=":0">{{Citace monografie\|příjmení = Hendl\|jméno = Jan\|příjmení2 = \|jméno2 = \|titul = Přehled statistických metod: analýza a metaanalýza dat\|vydání = \|vydavatel = Portál\|místo = Praha\|rok = 2012\|počet stran = 736\|strany = 39\|isbn = 978-80-262-0200-4}}</ref> Příklad na dvou pětičlenných skupinách osob: Osoby v první skupině jsou [[Vegetariánství\|vegetariáni]] a pravidelně cvičí, opačně je tomu u osob ve skupině druhé. Pět let sledujeme zdravotní stav osob obou skupin. Závěry se pokaždé mohou lišit. Jednou může být na tom po zdravotní stránce lépe skupina první, podruhé naopak skupina druhá. Platí tedy, že čím větší velikost vzorku populace, tím se [[variabilita]] výsledků minimalizuje a předchází se tak náhodné chybě. Výběrová systematická chyba označuje zkreslení, které vzniklo důsledkem upřednostnění některých hodnot proměnných v plánu výzkumu.<ref name=":0" /> Například studujeme-li skupinu zaměstnaných a [[Nezaměstnanost\|nezaměstnaných]] a ptáme se na jejich zkušenosti v období, kdy byly bez práce. Za věrohodnější a přesnější pak považujeme výpovědi aktuálně nezaměstnaných, což vede ke zkreslení výzkumu. Řádek 18: == Reference == <references /> {{Autoritní data}} [[Kategorie:Statistika]] [[Kategorie:Sociologická metodologie]]

Výběrový soubor: Porovnání verzí