Statistická nezávislost

stav, kdy výskyt jednoho náhodného jevu nemá vliv na pravděpodobnost výskytu druhého jevu

Nezávislost je základní pojem teorie pravděpodobnosti, matematické statistiky a teorie stochastických procesů. Dva náhodné jevy jsou nezávislé, statisticky nezávislé nebo stochasticky nezávislé,[1] pokud výskyt jednoho nemá vliv na pravděpodobnost výskytu druhého (ekvivalentně řečeno, nemá vliv na šance výskytu druhého jevu). Podobně jsou dvě náhodné veličiny nezávislé, pokud realizace jedné neovlivní rozdělení pravděpodobnosti druhé. Definiční a často využívanou vlastností nezávislých jevů je, že pravděpodobnost jejich společného výskytu se rovná součinu pravděpodobností jejich výskytů. Opakem nezávislosti je statistická závislost, například korelace.

Vrhneme-li zároveň dvě hrací kostky, lze čísla, která padnou, považovat za nezávislá, protože znalost čísla na jedné kostce nic neříká o tom, co padlo na druhé z nich

Pokud jde o soubor více než dvou jevů, je třeba rozlišovat slabé a silné pojetí nezávislosti. Jevy se nazývají po dvou nezávislé, pokud jsou jakékoli dva jevy v souboru nezávislé, a nezávislé (nebo kolektivně nezávislé), pokud každý jev je nezávislý na jakékoli kombinaci dalších jevů v souboru. Podobná definice platí pro soubory náhodných proměnných. Z (kolektivní) nezávislosti plyne nezávislost po dvou, ale naopak to neplatí.

Obecnějším konceptem je podmíněná nezávislost, která vyjadřuje, že dva náhodné jevy či veličiny A a B jsou nezávislé ve smyslu pravděpodobností podmíněných třetím náhodným jevem či veličinou Z. To neformálně řečeno znamená, že jakmile máme k dispozici informaci obsaženou v Z, není už další informace A užitečná pro přesnější poznání B ani znalost B nepřidá nic pro pochopení A, i kdyby A a B byly vzájemně závislé.

Příklady editovat

Házení hrací kostkou: Jev, že padne 6 při prvním hodu kostkou a jev padnutí 6 při druhém hodu jsou nezávislé. Naproti tomu jev, že padne 6 při prvním hodu kostkou a jev, že součet čísel zaznamenaných v prvním a druhém pokusu je 8, nejsou nezávislé jevy.

Tahání náhodných karet z promíchaného balíčku: Pokud jsou z balíčku karet vytaženy dvě karty s vracením (první vytažená karta se vrátí do balíčku před tažením druhé karty), jsou jevy vytažení červené karty v prvním pokusu a vytažení červené karty ve druhém pokusu nezávislé. Naproti tomu pokud jsou dvě karty vytaženy bez vracení, událost tažení červené karty v prvním pokusu a událost tažení červené karty ve druhém pokusu nejsou nezávislé, protože po vytažení první červené karty balíček už obsahuje o jednu červenou kartu méně.

Definice editovat

Náhodné jevy editovat

Viz též Pravděpodobnost#Nezávislé jevy.

Dva náhodné jevy   a   jsou nezávislé (zapsáno   nebo  ) právě tehdy, pokud se pravděpodobnost jejich společného výskytu rovná součinu pravděpodobností jejich výskytů:[2] :s.p. 29 [3] :s.p. 10

 

Proč se nezávislost definuje takto, je jasné po přepsání s použitím podmíněných pravděpodobností:

  .

a podobně

  .

To znamená, že výskyt   nemá vliv na pravděpodobnost   a naopak. Ačkoli se odvozené výrazy mohou zdát intuitivnější, nejedná se o upřednostňovanou definici, protože podmíněné pravděpodobnosti nemusejí být definované, pokud   nebo   jsou 0. Kromě toho upřednostňovaná definice je zjevně symetrická, takže je z ní vidět, že když   je nezávislý na  , tak   je také nezávislý na  .

  .

Zobecnění na více jevů: Konečná množina jevů   je po dvou nezávislá, pokud je každá dvojice jevů nezávislá — to znamená, že pro všechny vzájemně odlišné páry indexů  

 

Konečná množina jevů je nezávislá, pokud je každý jev nezávislý na libovolném průniku ostatních jevů[3] :s.p. 11 — to znamená, že pro každé   a pro každou   -prvkovou podmnožina jevů   z   platí

 

Toto se nazývá pravidlo násobení pravděpodobností pro nezávislé jevy. Všimněte si, že nejde o jedinou podmínku zahrnující pouze součin všech pravděpodobností všech jednotlivých jevů; vzorec musí platit pro všechny podmnožiny dané množiny jevů.

Pro více než dva jevy je nezávislá množina jevů (podle definice) také nezávislá po dvou; ale opak nemusí nutně platit.[2]:s.p. 30

Náhodné veličiny editovat

Dvě reálné náhodné veličiny   a   jsou nezávislé tehdy a právě tehdy, jsou-li prvky jimi generovaného π systému nezávislé; to znamená, že pro každé   a   jsou jevy   a   nezávislé (jak je definováno výše). Z toho plyne, že   a   s distribučními funkcemi   a   jsou nezávislé, pokud kombinovaná náhodná proměnná   má kumulativní distribuční funkci[3]:s.p. 15

 ,

z čehož plyne, že pokud existují hustoty pravděpodobnosti   a   a společná hustota pravděpodobnosti  , tak

  .

Zobecnění na více než dvě náhodné veličiny: Konečná množina   náhodných veličin   je po dvou nezávislá, jestliže je každá dvojice náhodných veličin z této množiny nezávislá.

Konečná množina   náhodných veličin   je nezávislá, jestliže pro jakoukoli posloupnost čísel   jsou jevy   vzájemně nezávislé (jak je definováno výše). To je ekvivalentní následující podmínce o společné distribuční funkci  : množina   je nezávislý právě tehdy, když[3]:s.p. 16

 

Všimněte si, že zde není nutné vyžadovat, aby rozdělení pravděpodobnosti faktorizovalo pro všechny možné podmnožiny   prvků jako v případě pro   jevů. Je to proto, že např.   totiž implikuje   atp.

Náhodné vektory editovat

Dva reálné náhodné vektory   a   jsou nezávislé, pokud[4]:s.p. 187

 ,

kde   a   jsou distribuční funkce   a   a   označuje jejich společnou distribuční funkci. Nezávislost   a   se často označuje   . Rozepsáno po komponentách:

  .

Stochastické procesy editovat

Definici nezávislosti lze rozšířit z náhodných vektorů na stochastické procesy. Nezávislý stochastický proces je takový, u kterého náhodné veličiny získané jeho vzorkováním v libovolných   časových okamžicích   (pro libovolné přirozené  ) jsou nezávislé náhodné veličiny.[5]:s.p. 163

Formálně zapsáno se stochastický proces   nazývá nezávislý, právě když pro všechna   a pro všechny  

 ,

kde   . Nezávislost stochastického procesu je jeho vnitřní vlastnost, nikoli vztah mezi dvěma různými stochastickými procesy.

Vzájemná nezávislost dvou stochastických procesů je vztah mezi dvěma stochastickými procesy   a   definovanými na stejném pravděpodobnostním prostoru  . Formálně dva stochastické procesy   a   jsou považovány za nezávislé, pokud pro všechna   a pro všechny   jsou náhodné vektory   a   navzájem nezávislé,[6]:s.p. 515 tj. pokud

 
 

Vlastnosti editovat

Nezávislost na sobě samém editovat

Všimněte si, že jev je na sobě nezávislý právě tehdy, když

 

Jev je tedy na sobě nezávislý, právě když k němu skoro jistě dojde nebo skoro jistě nedojde (dojde k jeho doplňku); tato skutečnost je užitečná při dokazování různých vět, které tvrdí, že nějaký jev má buď pravděpodobnost jedna nebo nula, nic mezi (anglicky tzv. zero-one laws).

Střední hodnota a kovariance editovat

Pokud   a   jsou nezávislé náhodné veličiny, pak operátor střední hodnoty   má vlastnost

 

a kovariance   je nula, jak vyplývá z

  .

Opačné tvrzení neplatí: pokud dvě náhodné proměnné mají kovarianci 0, stále nemusejí být nezávislé.

Podobně pro dva stochastické procesy   a   : Pokud jsou nezávislé, pak jsou nekorelované.[7]:s.p. 151

Charakteristická funkce editovat

Dvě náhodné proměnné   a   jsou nezávislé právě tehdy, pokud charakteristická funkce náhodného vektoru   splňuje

  .

Konkrétně charakteristická funkce jejich součtu je produktem jejich marginálních charakteristických funkcí:

 

ačkoli obrácená implikace neplatí.

Testování nezávislosti editovat

Častou úlohou v matematické statistice je testování hypotézy, že naměřené veličiny jsou vzájemně nezávislé. Pro nominální znaky se k tomu účelu používá test nezávislosti nominálních znaků, jeden z rodiny chí kvadrátových testů. Pro znaky vyšších typů se obvykle používá testování nulovosti korelačních koeficientů (typicky Spearmanovy či Pearsonovy korelační koeficienty), i když je nutno mít na paměti, že nekorelovanost je nutným, ale nikoli dostatečným předpokladem stochastické nezávislosti, takže se může stát, že veličiny jsou nekorelované, ale přitom vzájemně závislé.

Podmíněná nezávislost editovat

Pro jevy je podmíněná nezávislost definována takto: Jevy   a   jsou podmíněně nezávislé vzhledem k jevu  , když

  .

Pro náhodné veličiny je definice podobná. Neformálně řečeno jsou dvě náhodné veličiny   a   podmíněně nezávislé vzhledem k  , pokud platí, že jakmile je známa hodnota  , tak   už nepřidá žádné další informace o   . Například dvě měření   a   stejné hodnoty   nejsou nezávislé, ale jsou podmíněně nezávislé vzhledem k   (pokud chyby v obou měřeních nejsou nějakým způsobem spojeny).

Formální definice podmíněné nezávislosti je založena na myšlence podmíněného rozdělení Pokud  ,   a   jsou diskrétní náhodné veličiny, pak definujeme   a   jako podmíněně nezávislé vzhledem k  , pokud

 

pro všechny  ,   a   takové, že  . Dále pokud jsou náhodné proměnné spojité a mají společnou funkci hustoty pravděpodobnosti  , pak   a   jsou podmíněně nezávislé vzhledem k  , pokud

 

pro všechna reálná čísla  ,   a   taková, že   .

Je-li diskrétní   a   jsou podmíněně nezávislé vzhledem k  , pak

 

pro všechny  ,   a   při podmínce  . To znamená, že rozdělení   podmíněné   a   je stejné jako rozdělení podmíněné jen samotným  . Podobná rovnice platí pro podmíněné funkce hustoty pravděpodobnosti v spojitém případě.

Nezávislost lze chápat jako zvláštní druh podmíněné nezávislosti, protože na pravděpodobnost lze pohlížet jako na zvláštní případ podmíněné pravděpodobnosti, pokud ji nepodmiňujeme žádným jevem.

Pro statistické testování podmíněné nezávislosti se používají chí-kvadrát testy a testy parciálních korelací.

Příklad podmíněné nezávislosti: Teplota a intenzita osvětlení na nějakém místě bývají korelovány, protože v noci a v zimě je obvykle méně světla a zároveň nižší teplota. Ze znalosti teploty tedy můžeme pomocí regresní analýzy upřesnit odhad intenzity osvětlení a naopak. Kdybychom však k pozorování teploty a intenzity osvětlení přidali ještě údaj o přesném čase, tak se může stát, že znalost teploty již (příliš) nevylepší odhad intenzity osvětlení nad rámec odhadu založeného na čase, takže osvětlení a teplota budou (téměř) statisticky nezávislé podmíněno časem.

Reference editovat

V tomto článku byl použit překlad textu z článku Independence (probability theory) na anglické Wikipedii.

  1. RUSSELL, STUART J. (STUART JONATHAN). Artificial intelligence : a modern approach. Second edition. vyd. Upper Saddle River, N.J.: [s.n.] xxviii, 1081 pages s. Dostupné online. ISBN 0-13-790395-2, ISBN 978-0-13-790395-5. OCLC 51325314 
  2. a b FLORESCU, IONUŢ, 1973-. Probability and stochastic processes. Hoboken, New Jersey: [s.n.] 1 online resource s. Dostupné online. ISBN 978-1-118-59320-2, ISBN 1-118-59320-0. OCLC 879851902 
  3. a b c d GALLAGER, ROBERT G. Stochastic processes : theory for applications. Cambridge, United Kingdom: [s.n.] xx, 536 pages s. Dostupné online. ISBN 978-1-107-03975-9, ISBN 1-107-03975-4. OCLC 833145212 
  4. PAPOULIS, ATHANASIOS, 1921-2002. Probability, random variables, and stochastic processes. 3rd ed. vyd. New York: McGraw-Hill xvii, 666 pages s. Dostupné online. ISBN 0-07-048477-5, ISBN 978-0-07-048477-1. OCLC 22704249 
  5. HSU, HWEI P. (HWEI PIAO), 1930-. Schaum's outline of theory and problems of probability, random variables, and random processes. New York: McGraw-Hill 1 online resource (vii, 306 pages) s. Dostupné online. ISBN 0-585-26729-4, ISBN 978-0-585-26729-6. OCLC 45728870 
  6. LAPIDOTH, AMOS,. A foundation in digital communication. Second edition. vyd. Cambridge, U.K.: [s.n.] 1 online resource s. Dostupné online. ISBN 978-1-316-82270-8, ISBN 1-316-82270-2. OCLC 981922787 
  7. PARK, KUN IL, 1942-. Fundamentals of probability and stochastic processes with applications to communications. Cham: Springer 1 online resource (277 pages) s. Dostupné online. ISBN 978-3-319-68075-0, ISBN 3-319-68075-7. OCLC 1013827417 

Externí odkazy editovat