Strategie (teorie her): Porovnání verzí

Smazaný obsah Přidaný obsah
Robot: Opravuji 1 zdrojů a označuji 0 zdrojů jako nefunkční) #IABot (v2.0.9.2
m Dobrý den, chtěl bych požádat o přiřazení úpravy stránky k mému účtu. Provedl jsem ho bez přihlášení, stejně jako všechny další (cca 15) úprav z IP adresy 94.101.209.211. Děkuji a přeji hezký den.
značky: ruční vrácení zpět revertováno problematické ISBN odkazy na rozcestníky
Řádek 1:
V [[teorie her|teorii her]] je [[strategie]] kompletní sada možností, které má hráč k dispozici, aby mohl hru hrát v jakékoli situaci <ref name="friebelova">Friebelová, Jana. ''Teorie her ''[online].[Cit. 07-12-2006].[http://www2.ef.jcu.cz/~jfrieb/rmp/data/teorie_oa/TEORIE%20HER.pdf Dostupné online] {{Wayback|url=http://www2.ef.jcu.cz/~jfrieb/rmp/data/teorie_oa/TEORIE%20HER.pdf |date=20070221142004 }}</ref>. Strategie tedy plně definuje možnosti [[hráč]]ova [[rozhodování]].
Prostor strategií je seznam všech možných alternativ, které jsou hráči dostupné. Hra v normálním tvaru, je určená třemi [[množina]]mi. Mimo jiné i množinou všech prostorů strategii: <math> \{X_1,X_2,...,Xn\}</math>. Zde <math> X_i</math> označuje prostor strategií i-tého hráče <ref name="dlouhy">Dlouhý, Martin - Fiala, Petr ''Úvod do teorie her '' Oeconomica, 2007. [Cit. 01-01-2007]. {{ISBN|: 978-80-245-1273-0}}</ref>.
Strategický profil (občas nazvaný strategická kombinace) je prostor strategií pro každého hráče který plně určuje všechny akce ve hře. Profil strategie musí obsahovat pouze jednu strategii pro jednoho hráče.
 
Někdy dochází k záměně významu pojmu strategie a tah (anglicky move). Tah je akce vyvolaná hráčem v nějakém bodě během hry. Například v [[šachy|šachu]] je za tah považovat přesun jedné figurky podle daných [[pravidla|pravidel]] (pohyb střelce z C1 na G5). Na druhou stranu strategie je soubor tahů, které tvoří komplexní způsob hraní hry na několik kol dopředu. Tah je tedy součástí strategie <ref name="kos">Kos, Zdeněk. ''Rozhodovací procesy v životním prostředí - Teorie her ''[online].[Cit. 21-05-2008].[http://storm.fsv.cvut.cz/on_line/rpz/11-Teorie_her_uvod.pdf Dostupné online] {{Wayback|url=http://storm.fsv.cvut.cz/on_line/rpz/11-Teorie_her_uvod.pdf |date=20120131072731 }}</ref>.
 
Pokud jsou množiny strategií jednotlivých hráčů konečné, hovoříme o konečných hrách, je-li množina strategií alespoň jednoho hráče nekonečná, jde o nekonečnou hru<ref name="kos"/>.
Řádek 9:
== Prostor strategií ==
 
Účastníci hry jsou hráči, každý hráč vybírá optimální strategii ze svého prostoru strategií podle hodnot výplatní funkce. Hráčův prostor strategií tedy definuje, jaké strategie je možné hrát. Předpokládáme, že hráči jsou [[inteligence|inteligentní]] ([[racionální]]), tj. že maximalizují
hodnotu své výplatní [[funkce (matematika)|funkce]]. Dále předpokládáme, že hráči mají dokonalé [[informace]], tj. že znají množiny hráčů, prostorů strategií i výplatních funkcí <ref name="dlouhy"/>.
 
Řádek 17:
* Hraju papír
 
Každý z hráčů má tedy svou množinu přípustných řešení, kterou nazýváme prostorem strategií. Z této množiny volí hráči svoje rozhodnutí - strategii. Ukazatel, který zhodnotí důsledek volby strategie, se nazývá užitkovou funkci a hodnota tohoto ukazatele se nazývá výhra <ref name="dankova">Daňková, Kateřina. ''Teorie her a její aplikace - Bakalářská práce ''[online].[Cit. 10-04-2008].[http://mant.upol.cz/soubory/OdevzdanePrace/B08/b08-23-kd.pdf Dostupné online] {{Wayback|url=http://mant.upol.cz/soubory/OdevzdanePrace/B08/b08-23-kd.pdf |date=20120710162729 }}</ref>.
 
=== Výplatní funkce ===
 
Pro každého hráče je definována tzv. výplatní funkce, která každé kombinaci strategií hráčů přiřadí velikost výplaty tohoto hráče. Platba neboli výplata hry je výsledek hry jednotlivých hráčů v závislosti na jimi vybraných strategiích.
 
Pokud uvažujeme hru hranou v normální tvaru, pak budeme rozumět trojici množin <math> \{\{1,2,..,n\},\{S1,..,Sn\},\{Z1,..,Zn\}\}</math>, kde <math> \{1,2,..,n\}</math> je množina hráčů, <math> \{S_1,..,S_n\}</math> je množina prostorů strategií a <math>\{Z_1,..,Z_n\}</math> je množina výplatních funkcí hráčů. Každému hráči <math>i</math> náleží strategie obsažené v příslušném <math> S_i </math>. Strategie je úplný popis jak odehrát hru a každému hráči poskytuje představu o návaznosti na kroky jeho spoluhráčů. Při hraní hry v normálním tvaru si každý hráč zvolí určitou strategii <math> x_i\in S_i </math> a sada všech zvolených strategií (všech hráčů) dává příslušnou hodnotu výplatní funkce <math> Z_i(x_1,..,x_n) </math> pro hráče <math> i.^2</math> Všichni hráči znají strategie své i svých spoluhráčů a znají všechny hodnoty výplatních funkcí <ref name="pelis">Peliš, Michal. ''Teorie her jako formální teorie racionálního rozhodování ''[online].[Cit. 06-02-2007].[http://web.ff.cuni.cz/~pelis/gt-pelis.pdf Dostupné online] {{Wayback|url=http://web.ff.cuni.cz/~pelis/gt-pelis.pdf |date=20070613170727 }}</ref>.
 
=== Inteligentní hráč ===
Teorie her předpokládá, že si hráč vybírá pouze [[efektivita|efektivní]] strategie. Například ve hře nazvané [[vězňovo dilema]] se předpokládá, že žádný z hráčů se nechce nechat dobrovolně uvěznit. Očekává se, že hráč je konfrontován s určitým počtem situací a dokáže si je seřadit podle svých [[preference|preferencí]] od nejvýhodnější po nejméně výhodnou. Toto seřazení musí být úplné, tj. musí pokrývat všechny situace, a [[tranzitivita|tranzitivní]], tj. pokud dá hráč přednost situaci A před situací B a situaci B před situací C, musí dát přednost situaci A před situací C. Na základě preferencí situací je odvozena užitková funkce (utility function) <ref name="drulak">Drulák, Petr. ''Teorie her: matematika interaktivního rozhodování ''[online].[Cit. 01-10-2008].[http://www.portal.cz/scripts/detail.php?id=2232 Dostupné online]</ref>.
Hráč je inteligentní (racionální) pouze tehdy, pokud maximalizuje hodnotu své výplatní funkce (tj. svojisvojí výhru) <ref name="dlouhy"/> .
Naopak hráči, kteří se konfliktu (hry) účastní, ale výsledek hry je nezajímá, jsou nazýváni neinteligentními hráči. Tito hráči ve hře vystupují jako náhodný mechanismus, který ovlivňuje výsledky inteligentních hráčů. Často se pro neinteligentního hráče používá též termín příroda <ref name="kos"/>. Termín Příroda navrhl [[John Harsanyi]] ([[1967]]-[[1968]]), nositel [[Nobelova cena|Nobelovy ceny]] za [[ekonomie|ekonomii]]. Představme si situaci s neúplnou informací, která zvyšuje nutnost uvažování názoru hráče na preference ostatních hráčů, jeho názory na názory ostatních o jeho preferencích, jeho názory o jejich názorech, o jeho názorech na jejich preference, atd. A takto se spustí cyklický systém názorů. Právě HarsanyihoHarsanyho teorie neúplných informací nabízí způsob doplnění [[struktura|struktury]], ve které je informace neúplná. Hlavní principem je výpočet očekávané hodnoty. Navrhl zavést [[apriorní]] tah fiktivního hráče, nazvaného právě Příroda, který určuje typ každého hráče. Typ každého hráče a tudíž i jeho preference jsou výsledkem hodnoty náhodné proměnné, vybrané Přírodou <ref name="dlouhy"/>.
Klasické [[model (abstrakce)|modelymodel]]y teorie her považují strategie jednotlivých hráčů za ucelený souhrn jejich chování, takže jakmile hráč nějakou svoji strategii vybere, nemá možnost své jednání již korigovat <ref name="kos"/>.
=== Konfliktní hra ===
Základním pojmem teorie her je [[konflikt|konfliktní]] situace. Tímto pojmem jsou označovány všechny situace, ve kterých jde o [[střet zájmů]] účastníků konfliktu. Dosažení [[cíl]]e jednotlivých účastníků je omezováno nebo korigováno cíli a zájmy ostatních <ref name="kos"/>.
 
Konfliktní situace může mít charakter:
* [[antagonismus|antagonistický]]
* neantagonistický
 
V případě antagonistického konfliktu dosažení cíle jedním z účastníků zamezí pozitivnímu výsledku ostatních, úspěch každého z hráčů je možný pouze na úkor úspěšnosti ostatních hráčů. AntagonistickéAntagonické konfliktní situace musí vyhovovat následujícím podmínkám:
* Zúčastnit se musí minimálně dva účastníci.
* Každý z účastníků rozhodovací situace zná množinu alternativ svého chování, ale také zná množinu alternativ chování svého protivníka / protivníků.
* Každý z účastníků rozhodovací situace dokáže ocenit efektivnost své volby ve všech možných případech, které by mohly nastat.
* Každý z účastníků rozhodovací situace volí z množných alternativ nezávisle na volbách protivníků <ref name="pytlickova">Pytlíčková, Lenka. ''Elementy teorie her - Bakalářská práce ''[online].[Cit. 15-04-2008].[http://mant.upol.cz/soubory/OdevzdanePrace/B08/b08-05-lp.pdf Dostupné online]{{Nedostupný zdroj}}</ref>.
Alespoň jeden účastník rozhodovací situace je inteligentní hráč, tzn. že jeho jednání je uvědomělé a volbou strategie sleduje určitý cíl. V případě neantagonistického konfliktu mají všichni účastníci možnost více či méně realizovat svoje cíle. V neantagonistickém konfliktu nejsou cíle hráčů protichůdné a hráči mohou i spolupracovat <ref name="kos"/>.
 
=== Optimální strategie ===
Optimální strategie je taková strategie, od níž žádná odchylka nemůže přinést hráči výhody, za předpokladu, že druhý hráč zachová svojí optimální strategii <ref name="roubal">Roubal, Jiří. ''Teorie her ''[online].[Cit. 31-01-2006].[http://support.dce.felk.cvut.cz/pub/roubalj/teaching/ORR/seminars/ORR_cv4_ths.pdf Dostupné online]{{Nedostupný zdroj}}</ref>. Takto definované optimální strategie představují tzv. [[Nashova rovnováha|Nashovu rovnováhu]] (Nashovo rovnovážné řešení) a nazýváme je rovnovážnými strategiemi <ref name="dlouhy"/>.
 
U her, které hrají dva inteligentní hráči, je poměrně snadné stanovit optimální strategii, neboť například
Například u her s nulovým součtem (se sumou rovnou nule) je [[zisk]] jednoho hráče záporně vzatý „zisk“ druhého hráče. V případě her hraných proti přírodě však nastávají potíže <ref name="kos"/>.
 
Rozlišujeme dvě varianty rozhodování ve hře proti přírodě, které vznikají v antagonistickém konfliktu:
* Rozhodování při [[riziko|riziku]]
* Rozhodování při nejistotě <ref name="roubal"/>.
 
==== Rozhodování při riziku ====
Jestliže hráč 1 zná (například na základě předchozí zkušenosti) pravděpodobnostipravděpodobnost, s nimiž hráč 2 volí své strategie, pak se jedná o rozhodování při riziku <ref name="kos"/>.
 
==== Rozhodování při nejistotě ====
 
Jestliže však toto rozložení [[pravděpodobnost|pravděpodobností]]í hráč nezná, mluvíme o rozhodování při nejistotě.
==== Rozhodovací principy ====
V rozhodování o riziku a nejistotě využíváme [[Laplace|Laplaceův]]ův princip. Ten navrhuje zvolit takovou strategii, která by byla optimální v případě, že by pravděpodobnostipravděpodobností, s nimiž nastanou různé stavy světa, byly shodné, tj. jako kdyby se jednalo o rozhodování za rizika se stejnými pravděpodobnosti přiřazenými jednotlivým stavům.
* '''Maximinní (pesimistické) kriterium''': Tento princip navrhuje pro jednotlivé možné strategie stanovit nejnižší hodnoty užitku a zvolit takovou strategii, pro kterou je toto minimum maximální. Rozhodovatel tedy předpokládá, že se jej okolní svět bude „snažit“ co nejvíce poškodit.
* '''Maxmaxní (optimistické) kriterium''': Tento princip navrhuje pro jednotlivé možné strategie stanovit nejvyšší hodnoty užitku a zvolit takovou strategii, pro kterou je toto maximum maximální. Rozhodovatel tedy předpokládá, že se mu okolní svět bude „snažit“ co nejvíce pomoci.
* '''Hurwitzovo kritérium''': Jde o konvexní kombinaci optimistického a pesimistického kritéria. Vhodná volba parametru <math>\alpha</math> umožní nastavit vhodný [[kompromis]] mezi oběma krajnostmi – často nepřijatelné podle opatrnéhodůvěřivým, resp. nepřijatelné podlenepřijatelně důvěřivéhoopatrným kritériakritériem <ref name="hyksova">Hýkšová, Magdalena. ''Teorie her ''[online].[Cit. 21-01-2009].[http://euler.fd.cvut.cz/predmety/teorie_her/hry_t.pdf Dostupné online]</ref>.
 
== Ryzí a smíšená strategie ==
Řešením hry v případě her v maticovém stavu může být ryzí nebo smíšená strategie <ref name="brozova">Brožová, Helena. ''Rozhodovací modely a znalostní management ''[online].[http://etext.czu.cz/php/skripta/skriptum.php?titul_key=78 Dostupné online] {{Wayback|url=http://etext.czu.cz/php/skripta/skriptum.php?titul_key=78 |date=20090228194856 }}</ref>. Jedná se o antagonistický konflikt s konečným počtem strategií.
 
=== Ryzí strategie ===
Řešení hry v oboru čistých strategií znamená, že hráč dosáhne svého cíle pouze pomocí jediné své strategie. Ať se hra opakuje (má několik partií) nebo je hrána pouze jedenkrát (má jedinou partii), optimální chování hráče je dáno právě touto jedinou strategií.
Ryzí optimální strategii hráče <math> A</math> budeme značit <math> A_0</math> a tato strategie přinese hráči <math> A</math> maximální výhru, ať již hráč <math> B</math> volí jakoukoli strategii. Ryzí optimální strategiistrategií hráče <math> B</math> budeme značit <math>B_0</math>. Je to strategie, která zaručí hráči <math> B</math> minimální prohru, ať již hráč<math>A</math> volí jakoukoli strategii. Pro strategie <math>i= 1, 2, ..., m</math> a <math>j= 1, 2, ..., n</math> platí:
<br />
<br />
<math> M(A_i, B_0) \leq M(A_0, B_0) \leq M(A_0, B_j) </math>
<br />
<br />
Lze tedy říci, že jakýkoliv hráč si pohorší, pokud se odkloní od své optimální ryzí strategie. Cena hry <math>(v)</math> je hodnota výplatní funkce <math>M (A_0, B_0 ) </math>. Pokud je cena hry nulová, jedná se o hru spravedlivou, pokud není, jedná se o hru nespravedlivou <ref name="friebelova"/>.
První hráč vybírá nejvyšší z nejnižších výher, kterou nazýváme dolní cena hry. Druhý hráč naopak vybírá nejmenší z nejvyšších proher, tento výsledek hry je nazýván horní cena hry.
Za předpokladu rovnosti dolní a horní ceny hry je evidentní, že oba hráči nemají lepší volbu strategií. Vyberou-li své strategie jinak, bude jejich výhra menší, resp. prohra větší. Takto vybraná dvojice strategií se nazývá ''sedlovým bodem hry''<ref name="brozova" />.
 
=== Sedlový bod ===
[[Soubor:Saddle point.png|náhledthumb|vlevoleft|200px|Sedlový bod na grafu z=x<sup>2</sup>−y<sup>2</sup>]]
Hledáme-li optimální řešení antagonistického konfliktu hledáme vlastně stabilní řešení, stabilní v tom smyslu, že ani jednomu hráči se nevyplatí od této strategie „utéct“. Tj. má to být takové řešení, aby pokud pouze první hráč změní strategii a druhý hráč zůstane u své strategie, potom si první hráč pohorší. Stejně tak s druhým hráčem. Ze stanovení dolní ceny hry a horní ceny hry vyplývá, že optimální řešení antagonistického konfliktu (v ryzích strategiích) existuje, pokud platí:
<br />
<br />
<math> \begin{matrix} \\ \operatorname{Min} \\ { }^{j} \end{matrix} \
\begin{matrix} \\ \operatorname{Max} \\ { }^{i} \end{matrix} \ a_{ij} =
\begin{matrix} \\ \operatorname{Max} \\ { }^{i} \end{matrix} \
\begin{matrix} \\ \operatorname{Min} \\ { }^{j} \end{matrix} \ a_{ij}
</math>
</math><br /><br />Pokud je tato rovnost splněna, existuje prvek v [[matice|matici]] (hra je hraná v maticovém tvaru), který je nejmenší ve svém řádku a největší ve svém sloupci. Tento prvek nazýváme [[sedlový bod]]. Obecně hra v maticovém tvaru muže mít žádný, jeden nebo více sedlových bodů. Pokud nemá žádný, neexistuje optimální ryzí strategie, pokud má jeden, určuje optimální strategii, pokud jich má více, určuje alternativní optimální (rovnovážné) strategie.<ref name="friebelova"/> Maticová hra má řešení v oboru čistých strategií právě tehdy, když má sedlový bod. Z uvedené věty plyne, že řešit hru v oboru čistých strategií znamená nalézt sedlový bod hry. Odpovídající výhra, resp. prohra je cenou hry. Pokud se sedlový bod hry nepodaří nalézt, hra nemá v oboru čistých strategií řešení <ref name="brozova" />.
<br />
<br />
Pokud je tato rovnost splněna, existuje prvek v [[matice|matici]] (hra hraná v maticovém tvaru), který je nejmenší ve svém řádku a největší ve svém sloupci. Tento prvek nazýváme sedlový bod.
Obecně hra v maticovém tvaru muže mít žádný, jeden nebo více sedlových bodů. Pokud nemá žádný, neexistuje optimální ryzí strategie, pokud má jeden, určuje optimální strategii, pokud jich má více, určuje alternativní optimální (rovnovážné) strategie.<ref name="friebelova"/>
</math><br /><br />Pokud je tato rovnost splněna, existuje prvek v [[matice|matici]] (hra je hraná v maticovém tvaru), který je nejmenší ve svém řádku a největší ve svém sloupci. Tento prvek nazýváme [[sedlový bod]]. Obecně hra v maticovém tvaru muže mít žádný, jeden nebo více sedlových bodů. Pokud nemá žádný, neexistuje optimální ryzí strategie, pokud má jeden, určuje optimální strategii, pokud jich má více, určuje alternativní optimální (rovnovážné) strategie.<ref name="friebelova"/> Maticová hra má řešení v oboru čistých strategií právě tehdy, když má sedlový bod. Z uvedené věty plyne, že řešit hru v oboru čistých strategií znamená nalézt sedlový bod hry. Odpovídající výhra, resp. prohra je cenou hry. Pokud se sedlový bod hry nepodaří nalézt, hra nemá v oboru čistých strategií řešení <ref name="brozova" />.
 
=== Smíšená strategie ===
Pokud se nám nepodařilo najít sedlový prvek, znamená to, že dosavadní výklad nebyl dostatečný pro nalezení rovnovážných strategií ve všech možných rozhodovacích situacích, které je možné vyjádřit jako maticovou hru. Lze to vysvětlit na hře kámen-nůžky-papír. Tato hra je hrou dvou hráčů, z nichž každý má k dispozici tři možné strategie. Podle pravidel kámen vyhrává nad nůžkami, nůžky nad papírem a papír nad kamenem. V případě, že oba hráči zvolí stejnou strategii, nastává remíza. V reálné situaci by hráči hru opakovali, od toho však v tomto okamžiku abstrahujeme a považujeme remízu za konečný výsledek hry. Hra kámen, nůžky, papír je hrou s konstantním (nulovým) součtem, která je charakterizována maticí:
<br />
<br />
<math> \begin{pmatrix}0 & +1 & -1 \\-1 & 0 & +1 \\+1 & -1 & 0 \end{pmatrix}</math>
<br />
<br />
Je jednoduché si ověřit, že v této matici není možné najít sedlový prvek, takže ani není možné najít Nashovo rovnovážné řešení v ryzích strategiích. Přesto danou hru běžně dohrajeme a známe odpovídající rovnovážnou strategii, která spočívá v náhodném výběru z prostoru strategií. Pro oba hráče je rovnovážnou strategií vektor (1/3; 1/3; 1/3) kde čísla představují pravděpodobnosti, že hráč bude volit první, druhou nebo třetí strategii. Tento typ strategií nazýváme smíšenými (pravděpodobnostními) strategiemi. Také pro tyto strategie platí, že hráč, který se od rovnovážné strategie odchýlí (zvolí jiné pravděpodobnosti), nemůže nic získat, ale naopak může ztratit.
Pokud maticová hra nemá řešení v ryzích strategiích, použijeme tzv. smíšeného rozšíření maticové hry. Prostory strategií nyní budou představovat vektory pravděpodobnosti, s jakou hráči zvolí jednotlivé strategie.
Ryzí strategie jsou tedy zvláštním případem ([[Podmnožina|podmnožinou]]) smíšených strategií, kdy jedna z pravděpodobností je rovna jedné, a ostatní pravděpodobnosti jsou rovny nule. Pro maticové hry platí důležitá věta. Tzv. základní věta maticových her:
* Každá maticová hra má Nashovo rovnovážné řešení ve smíšených strategiích <ref name="dlouhy"/>.
 
Řádek 90 ⟶ 119:
* [[John Forbes Nash|John Nash]]
* [[Equilibrium (ekonomika)|Equilibrium]]
* [[SoubojBattle pohlavíof (teorie her)Sexes|SoubojBitva pohlaví]]
* [[No-win situation]]
* [[Dominantní strategie]]
 
=== Externí odkazy ===
 
* {{Cs}} [http://psh.ntkcz.cz/skos/PSH11427/html/cs Rozcestník k nalezení materiálů o teorii her ]{{Nedostupný zdroj}}
* {{en}} [http://stanford.library.usyd.edu.au/entries/game-theory/ Podrobné informace o teorii her] {{Wayback|url=http://stanford.library.usyd.edu.au/entries/game-theory/ |date=20091206124423 }}
{{Autoritní data}}
 
[[Kategorie:Teorie her]]