Analýza dat: Porovnání verzí

Přidáno 33 bajtů ,  před 1 měsícem
−nevhodné formátování, NK ČR, adata
(−nevhodné formátování, NK ČR, adata)
* '''[[Vytěžování dat]]''' (data mining) a blízce příbuzná '''[[datová věda]]''' (data science) jsou oblasti zaměřené na průběžné získávání prakticky použitelných informací z dat s tím, že těžiště data miningu je více v [[prediktivní modelování|prediktivním modelování]] (tj. předpovídání chování lidí či jiných jednotek) a těžiště datové vědy více ve zpracování [[Velká data|velkých dat]] (Big data) a tvorbě aplikací.
 
=== '''''<u>Analýza dat v sociologickém výzkumu</u>'''''<ref>{{Citace monografie
| příjmení = Hendl, Jan, 1947-
| titul = Přehled statistických metod zpracování dat : analýza a metaanalýza dat
| oclc = 1135606543
}}</ref> ===
<blockquote>''"vědecký„vědecký výzkum je systematické, kontrolované, empirické a kritické zkoumání hypotetických výroků o předpokládaných vztazích mezi přirozenými jevy."'' <ref>{{Citace periodika
| příjmení = Kerlinger
| jméno = Fred N.
* ''[[Empirické poznání|empirické]] vědecké bádání''  – znamená, že vědec musí podrobit svůj názor vnějšímu ověření
 
''<u>Sekundární analýza</u><ref>{{Citace elektronického periodika
| titul = 10
| periodikum = web.ftvs.cuni.cz
| url = http://web.ftvs.cuni.cz/hendl/metodologie/jerabek3/k10/10-1.htm
| datum přístupu = 2020-11-14
}}</ref>''
 
* Mezi zdroje dat pro sekundární analýzu patří archivní data, oficiální statistická data, databanky statistických údajů, datové publikace z výzkumů a datové soubory z výzkumů na počítači.
}}</ref> ====
 
==== '''Deskripce''' ====
Nejzákladnější úlohou statistické analýzy dat je popis (deskripce) souboru dat. Soubor jednotek je charakterizován z hledisek jednotlivých znaků a jejich kombinací, a to prostřednictvím tabulek [[četnost]]í (frekvencí) kategorizovaných znaků a výpočtu souhrnných statistických charakteristik spojitých i kategorizovaných znaků.
 
==== '''Komparace''' ====
Jednou z nejčastějších úloh je srovnání souborů nebo podsouborů z hlediska jednoho nebo několika znaků. Porovnává populace státních celků, národů, přirozených sociálních skupin nebo uměle vytvořených [[Sociální agregát|agregátů]]. Klade si za cíl ověřit rozdílnost mezi nimi nebo změření velikost tohoto rozdílu, nebo naopak je její snahou prokázat, že rozdíly mezi nimi jsou zanedbatelné, že tvoří z hlediska zkoumané charakteristiky jeden soubor. Podrobnější informaci poskytuje porovnání statistických rozložení znaku za podsoubory. To je však obtížnější a provádí se zřídka, ve speciálních úlohách.
 
==== '''Měření asociací a korelační analýza''' ====
Třetí skupinou úloh je zjišťování souvislostí mezi znaky (např. vztah mezi kouřením a konzumací alkoholu nebo mezi pozitivním postojem k ekonomické reformě a jednotlivými charakteristikami životní úrovně dotázaného). Zjišťuje, zda vztah mezi znaky je významný. K tomu slouží celá řada statistických testů lišících se podle typů znaků, které dávají do souvislosti. Další velmi častou úlohou je měření síly tohoto prokázaného vztahu. Přitom je třeba rozlišovat, zda se jedná o souvislost mezi dvěma [[Nominální proměnná|nominálními]] znaky, mezi znaky pořadovými nebo mezi znaky [[Kardinální číslo|kardinálními]]. Každé úrovni odpovídá jiná nabídka [[koeficient]]ů.
 
== Reference ==
<references />
 
== Externí odkazy ==
* {{NK ČR|ph301326|věc=ano}}
 
{{Autoritní data}}
 
[[Kategorie:Údržba:Články s referencemi v nadpisech]]