Úplná prostorová náhodnost

pojem z oboru statistika

Úplná prostorová náhodnost (anglicky Complete spatial randomness – CSR) popisuje bodový proces, při kterém se bodové události vyskytují v rámci dané sledované oblasti zcela náhodně. CSR je synonymem pro homogenní Poissonův prostorový proces.[1] Takový proces je často modelován pouze jednou proměnnou, tj. hustotou bodů ve vymezené oblasti. Termín úplná prostorová náhodnost je běžně používán v aplikované statistice v rámci zkoumání určitých bodových modelů, zatímco ve většině ostatních statistických kontextech odkazuje na koncept Poissonova prostorového procesu.[1]

Model editovat

Data v podobě sady bodů, nepravidelně rozmístěných v dané oblasti, se vyskytují v mnoha různých kontextech; například jako umístění stromů v lese, ptačích hnízd, jader v tkáni nebo poloha nemocných lidí. Jakýkoliv takový souboru dat nazýváme prostorový bodový model a odkazujeme jím na umístění jako na události, k odlišení od jakýchkoli jiných bodů příslušné oblasti. Hypotéza úplné prostorové náhodnosti prostorového bodového modelu tvrdí, že počet událostí jakékoli oblasti je dán Poissonovým rozdělením o daném průměru při jednotném rozdělení. Události modelu jsou nezávisle a rovnoměrně rozložené v prostoru. Jinými slovy, pro jednotlivé události je stejně pravděpodobné, že se vyskytnou kdekoli a bez vzájemných interakcí.

"Rovnoměrný" se používá ve smyslu stejnoměrného rozdělení pravděpodobnosti v celé studované oblasti, nikoli ve smyslu "rovnoměrného" rozptýlení ve sledované oblasti.[2] Mezi událostmi nedochází k žádným interakcím, jelikož intenzita událostí v rovině se nemění. Předpoklad nezávislosti by byl porušen například v případě, že by existence jedné události buď podnítila, nebo potlačila výskyt jiných událostí v okolí.

Rozdělení editovat

Pravděpodobnost nalezení právě   bodů v oblasti   s hustotou jevu   je tedy:

 

Prvním momentem, kterým je průměrný počet bodů v této oblasti, je  . Tato hodnota je intuitivní, tak jako Poissonův parametr.

Pravděpodobnost s jakou se v určité radiální vzdálenosti   nachází  -tý soused daného bodu, je:

 

kde   je počet rozměrů,   je intenzita daná vztahem   a   je gama funkce, která je faktoriální funkcí, jestliže je jeho argumentem integrál.

Předpokládanou hodnotu   je možné odvodit pomocí funkce gama, využívající statistické momenty. Prvním momentem je průměrná vzdálenost náhodně rozmístěných bodů v   rozměrech.

Aplikace editovat

Studie CSR je nezbytná pro porovnávání naměřených bodových dat z výzkumných zdrojů. Jako statistická testovací metoda, má testování CSR mnoho aplikací v oblasti společenských věd a v astronomických výzkumech.[3] CSR je standard, na kterému jsou často testovány datové soubory. Zde je zhruba popsán jeden z přístupů testování hypotézy CSR:[4]

  1. Použijte statistiky, které jsou funkcí vzdálenosti každé události od další nejbližší události.
  2. Nejdříve se zaměřte na konkrétní událost a zformulujte metodu testování, zda jsou si událost a další nejbližší událost významně blízké (nebo vzdálené).
  3. Poté vezměte v úvahu všechny události a zformulujte metodu testování, zda je průměrná vzdálenost každé události od další nejbližší události významně krátká (nebo dlouhá).

V případech, kdy je výpočet statistik analyticky obtížný, jsou numerické metody, jako je metoda Monte Carlo, použity k simulaci náhodného procesu s velkým počtem opakování.[4]

Reference editovat

V tomto článku byl použit překlad textu z článku Complete spatial randomness na anglické Wikipedii.

  1. a b O. Maimon, L. Rokach, Data Mining and Knowledge Discovery Handbook , Second Edition, Springer 2010, pages 851-852
  2. L. A. Waller, C. A. Gotway, Applied Spatial Statistics for Public Health Data, volume 1 Wiley Chichester, 2004, pages 119–121, 123–127, 137, 139–141, 146–148, 150–151, 157, 203.
  3. Statistics on Venus: Craters and Catastrophes [online]. Dostupné online. 
  4. a b A. Okabe, K. Sugihara, "Spatial Analysis along Networks- Statistical and Computational Methods", volume 1 Wiley Chichester, 2012, pages 135-136

Literatura editovat

  • DIGGLE, P. J. Statistical Analysis of Spatial Point Patterns. 2nd. vyd. New York: Academic Press, 2003. ISBN 0340740701. 

Externí odkazy editovat