Analýza dat: Porovnání verzí

Smazaný obsah Přidaný obsah
−nevhodné formátování, NK ČR, adata
Řádek 7:
* '''[[Vytěžování dat]]''' (data mining) a blízce příbuzná '''[[datová věda]]''' (data science) jsou oblasti zaměřené na průběžné získávání prakticky použitelných informací z dat s tím, že těžiště data miningu je více v [[prediktivní modelování|prediktivním modelování]] (tj. předpovídání chování lidí či jiných jednotek) a těžiště datové vědy více ve zpracování [[Velká data|velkých dat]] (Big data) a tvorbě aplikací.
 
=== '''''<u>Analýza dat v sociologickém výzkumu</u>'''''<ref>{{Citace monografie
| příjmení = Hendl, Jan, 1947-
| titul = Přehled statistických metod zpracování dat : analýza a metaanalýza dat
Řádek 29:
| oclc = 1135606543
}}</ref> ===
<blockquote>''"vědecký„vědecký výzkum je systematické, kontrolované, empirické a kritické zkoumání hypotetických výroků o předpokládaných vztazích mezi přirozenými jevy."'' <ref>{{Citace periodika
| příjmení = Kerlinger
| jméno = Fred N.
Řádek 52:
* ''[[Empirické poznání|empirické]] vědecké bádání''  – znamená, že vědec musí podrobit svůj názor vnějšímu ověření
 
''<u>Sekundární analýza</u><ref>{{Citace elektronického periodika
| titul = 10
| periodikum = web.ftvs.cuni.cz
| url = http://web.ftvs.cuni.cz/hendl/metodologie/jerabek3/k10/10-1.htm
| datum přístupu = 2020-11-14
}}</ref>''
 
* Mezi zdroje dat pro sekundární analýzu patří archivní data, oficiální statistická data, databanky statistických údajů, datové publikace z výzkumů a datové soubory z výzkumů na počítači.
Řádek 68:
}}</ref> ====
 
==== '''Deskripce''' ====
Nejzákladnější úlohou statistické analýzy dat je popis (deskripce) souboru dat. Soubor jednotek je charakterizován z hledisek jednotlivých znaků a jejich kombinací, a to prostřednictvím tabulek [[četnost]]í (frekvencí) kategorizovaných znaků a výpočtu souhrnných statistických charakteristik spojitých i kategorizovaných znaků.
 
==== '''Komparace''' ====
Jednou z nejčastějších úloh je srovnání souborů nebo podsouborů z hlediska jednoho nebo několika znaků. Porovnává populace státních celků, národů, přirozených sociálních skupin nebo uměle vytvořených [[Sociální agregát|agregátů]]. Klade si za cíl ověřit rozdílnost mezi nimi nebo změření velikost tohoto rozdílu, nebo naopak je její snahou prokázat, že rozdíly mezi nimi jsou zanedbatelné, že tvoří z hlediska zkoumané charakteristiky jeden soubor. Podrobnější informaci poskytuje porovnání statistických rozložení znaku za podsoubory. To je však obtížnější a provádí se zřídka, ve speciálních úlohách.
 
==== '''Měření asociací a korelační analýza''' ====
Třetí skupinou úloh je zjišťování souvislostí mezi znaky (např. vztah mezi kouřením a konzumací alkoholu nebo mezi pozitivním postojem k ekonomické reformě a jednotlivými charakteristikami životní úrovně dotázaného). Zjišťuje, zda vztah mezi znaky je významný. K tomu slouží celá řada statistických testů lišících se podle typů znaků, které dávají do souvislosti. Další velmi častou úlohou je měření síly tohoto prokázaného vztahu. Přitom je třeba rozlišovat, zda se jedná o souvislost mezi dvěma [[Nominální proměnná|nominálními]] znaky, mezi znaky pořadovými nebo mezi znaky [[Kardinální číslo|kardinálními]]. Každé úrovni odpovídá jiná nabídka [[koeficient]]ů.
 
Řádek 82:
== Reference ==
<references />
 
== Externí odkazy ==
* {{NK ČR|ph301326|věc=ano}}
 
{{Autoritní data}}
 
[[Kategorie:Údržba:Články s referencemi v nadpisech]]