Geostatistika je obor statistiky, který je zaměřený především na prostorová nebo časoprostorová data. Geostatistika původně vznikla jako nástroj k predikci pravděpodobnosti rozložení ložisek rud pro těžební průmysl. V současné době se uplatňuje v různých disciplínách, jako jsou například ropná geologie, hydrogeologie, hydrologie, meteorologie, oceánografie, geochemie, hutnictví, geografie, lesnictví, ochrana životního prostředí, krajinná ekologie, pedologie a zemědělství. Geostatistika je také využívána v různých oblastech geografie, zejména tam, kde se snaží zachytit a modelovat šíření chorob (epidemiologie), v geomarketingu, vojenském plánování a v rozvoji efektivnějších prostorových sítí. Geostatistické algoritmy jsou začleněny na mnoha dalších místech, včetně geografických informačních systémů (GIS) nebo statistického prostředí a programovacího jazyka R.

Teoretický základ editovat

Geostatistika je úzce spojena se základními interpolačními metodami, jejichž rámec však zdaleka překračuje. Geostatistické metody stojí na statistickém modelu, který je založen na teorii náhodné funkce (či náhodné regionalizané proměnné), kterou využívá k modelování nejistoty spojené s prostorovými odhady a simulacemi.

Řada jednodušších interpolačních metod/algoritmů, jako je metoda vážené inverzní vzdálenosti (IDW), bilineární interpolace a metoda nejbližšího souseda, byly známy již před vznikem geostatistiky. Geostatistika však přesahuje základní interpolační problém tím, že považuje studovaný jev na neznámých souřadnicích za soubor korelovaných náhodných proměnných.

Nechť Z(x) je hodnota požadované proměnné na určitém umístění x. Tato hodnota je neznámá (např. teplota, srážky, piezometrická úroveň). Ačkoliv na souřadnicích x existuje hodnota, kterou by bylo možné měřit, tak geostatistika tuto hodnotu považuje za čistě náhodnou, jelikož nebyla naměřena (nebo zatím nebyla naměřena). Nicméně, náhodnost Z(x) není úplná, ale je definována kumulativní distribuční funkcí (CDF), která je závislá na určitých informacích, které jsou známy o hodnotě Z(x):

 

Obvykle, pokud je hodnota Z známa na místech v blízkosti x (nebo v sousedství x), pak je možné tímto okolím omezit i CDF náležící Z(x): pokud je předpokládána vysoká prostorová spojitost, pak Z(x) může mít pouze hodnoty podobné těm, které se nacházejí v jeho okolí. Naopak, v případě neexistence prostorové spojitosti může Z(x) nabývat libovolné hodnoty. Prostorová spojitost náhodných proměnných je popsána modelem prostorové spojitosti, která může být buď parametrickou funkcí v případě, že vychází z geostatistického variogramu nebo má neparametrickou formu při použití jiných metod, jako je vícenásobná bodová simulace nebo pseudo-genetické techniky.

Při použití jednotného prostorového modelu pro celou oblast, je vycházeno z předpokladu, že Z je stacionární proces. To zjednodušeně znamená, že v celé oblasti je možné využít stejné statistické vlastnosti souboru. Několik geostatistických metod poskytuje způsoby uvolňující tento předpoklad stacionarity.

V tomto rámci lze rozlišit dva hlavní cíle modelování:

  1. Odhad hodnoty Z(x), obvykle odhadem střední hodnoty, mediánem nebo modem CDF f(z,x). Toto je obvykle označováno jako problém odhadu.
  2. Vzorkování z celé funkce hustoty pravděpodobnosti f(z,x), kde jsou skutečně posuzovány všechny možné alternativy vybraných vzorků na každém místě. Takto obvykle vzniká několik alternativních map odhadů Z, tzv. realizace. Uvažujme skupinu rozdělenou do N samostatných uzlů (nebo pixelů). Každá realizace je pak vzorkem úplného N-rozměrného spojení distribuční funkce
 

V tomto přístupu je tak uznávána přítomnost několika možných řešení interpolace. Každá realizace je považována za možný scénář odhadu reálných hodnot skutečné proměnné vzniklý za dané kombinace podmínek. Všechny související pracovní postupy jsou pak považovány za soubor realizací, a následně za soubor predikcí, které umožňují pravděpodobnostní předpovědi. Z tohoto důvodu je geostatistika často používána pro tvorbu nebo aktualizaci prostorových modelů při řešení inverzních problémů.

Řada metod existuje jak pro geostatistické odhady, tak i pro metody simulací (postup vícenásobných realizací).

Metody editovat

Odhad editovat

Kriging editovat

Kriging je skupina geostatistických technik sloužících k interpolaci hodnot náhodného pole (např. nadmořská výška, z, jako funkce závislá na geografické poloze) v místech, kde nebyl jev měřen či pozorován, z pozorování a měřených hodnot v místech, která jsou poblíž.

Indikátorový kriging editovat

Mnohoindikátorový kriging (MIK) je jedním z posledních zlepšení technik sloužících k modelování ložisek minerálů a modelu blokového odhadu zdrojů, podobně jako ordinary kriging. MIK představuje významný příslib mezi metodami, které umožňují celkové zpřesnění odhadu ložisek minerálů a jejich koncentrace.

Metody simulace editovat

Definice a nástroje editovat

Hlavní odborné časopisy píšící o geostatistice editovat

Vědecké organizace zabývající se geostatistikou editovat

Související programy editovat

  • The R programming language obsahuje přibližně 20 dalších rozšiřujících balíčků věnovaných geostatistice a zhruba 30 věnujících se jiné oblasti prostorové statistiky.
  • D-STEM je software na základě jazyka MATLAB, který je schopný zpracovávat jednorozměrné i vícerozměrné časoprostorové datové soubory. Tento software umožňuje vytvářet dynamické mapy pozorovaných proměnných v geografických regionech.

Související články editovat

Literatura editovat

  1. Armstrong, M and Champigny, N, 1988, A Study on Kriging Small Blocks, CIM Bulletin, Vol 82, No 923
  2. Armstrong, M, 1992, Freedom of Speech? De Geeostatisticis, July, No 14
  3. Champigny, N, 1992, Geostatistics: A tool that works, The Northern Miner, May 18
  4. Clark I, 1979, Practical Geostatistics, Applied Science Publishers, London
  5. David, M, 1977, Geostatistical Ore Reserve Estimation, Elsevier Scientific Publishing Company, Amsterdam
  6. Hald, A, 1952, Statistical Theory with Engineering Applications, John Wiley & Sons, New York
  7. Honarkhah, M and Caers, J, 2010, Stochastic Simulation of Patterns Using Distance-Based Pattern Modeling, Mathematical Geosciences, 42: 487 - 517 (best paper award IAMG 09)
  8. ISO/DIS 11648-1 Statistical aspects of sampling from bulk materials-Part1: General principles
  9. Lipschutz, S, 1968, Theory and Problems of Probability, McCraw-Hill Book Company, New York.
  10. Matheron, G. 1962. Traité de géostatistique appliquée. Tome 1, Editions Technip, Paris, 334 pp.
  11. Matheron, G. 1989. Estimating and choosing, Springer-Verlag, Berlin.
  12. McGrew, J. Chapman, & Monroe, Charles B., 2000. An introduction to statistical problem solving in geography, second edition, McGraw-Hill, New York.
  13. Merks, J W, 1992, Geostatistics or voodoo science, The Northern Miner, May 18
  14. Merks, J W, Abuse of statistics, CIM Bulletin, January 1993, Vol 86, No 966
  15. Myers, Donald E.; "What Is Geostatistics?
  16. Philip, G M and Watson, D F, 1986, Matheronian Geostatistics; Quo Vadis?, Mathematical Geology, Vol 18, No 1
  17. Sharov, A: Quantitative Population Ecology, 1996, https://web.archive.org/web/20020605050231/http://www.ento.vt.edu/~sharov/PopEcol/popecol.html
  18. Shine, J.A., Wakefield, G.I.: A comparison of supervised imagery classification using analyst-chosen and geostatistically-chosen training sets, 1999, https://web.archive.org/web/20020424165227/http://www.geovista.psu.edu/sites/geocomp99/Gc99/044/gc_044.htm
  19. Strahler, A. H., and Strahler A., 2006, Introducing Physical Geography, 4th Ed., Wiley.
  20. Tahmasebi, P., Hezarkhani, A., Sahimi, M., 2012, Multiple-point geostatistical modeling based on the cross-correlation functions[nedostupný zdroj], Computational Geosciences, 16(3):779-79742.
  21. Volk, W, 1980, Applied Statistics for Engineers, Krieger Publishing Company, Huntington, New York.

Externí odkazy editovat