Strategie (teorie her): Porovnání verzí
Smazaný obsah Přidaný obsah
Robot: Opravuji 1 zdrojů a označuji 0 zdrojů jako nefunkční) #IABot (v2.0.9.2 |
m Dobrý den, chtěl bych požádat o přiřazení úpravy stránky k mému účtu. Provedl jsem ho bez přihlášení, stejně jako všechny další (cca 15) úprav z IP adresy 94.101.209.211. Děkuji a přeji hezký den. |
||
Řádek 1:
V [[teorie her|teorii her]] je [[strategie]] kompletní sada možností, které má hráč k dispozici, aby mohl hru hrát v jakékoli situaci <ref name="friebelova">Friebelová, Jana. ''Teorie her ''[online].[Cit. 07-12-2006].[http://www2.ef.jcu.cz/~jfrieb/rmp/data/teorie_oa/TEORIE%20HER.pdf Dostupné online]
Prostor strategií je seznam všech možných alternativ, které jsou hráči dostupné. Hra v normálním tvaru, je určená třemi [[množina]]mi. Mimo jiné i množinou všech prostorů strategii: <math> \{X_1,X_2,...,Xn\}</math>. Zde <math> X_i</math> označuje prostor strategií i-tého hráče <ref name="dlouhy">Dlouhý, Martin - Fiala, Petr ''Úvod do teorie her '' Oeconomica, 2007. [Cit. 01-01-2007].
Strategický profil (občas nazvaný strategická kombinace) je prostor strategií pro každého hráče který plně určuje všechny akce ve hře. Profil strategie musí obsahovat pouze jednu strategii pro jednoho hráče.
Někdy dochází k záměně významu pojmu strategie a tah (anglicky move). Tah je akce vyvolaná hráčem v nějakém bodě během hry. Například v [[šachy|šachu]] je za tah považovat přesun jedné figurky podle daných [[pravidla|pravidel]] (pohyb střelce z C1 na G5). Na druhou stranu strategie je soubor tahů, které tvoří komplexní způsob hraní hry na několik kol dopředu. Tah je tedy součástí strategie <ref name="kos">Kos, Zdeněk. ''Rozhodovací procesy v životním prostředí - Teorie her ''[online].[Cit. 21-05-2008].[http://storm.fsv.cvut.cz/on_line/rpz/11-Teorie_her_uvod.pdf Dostupné online]
Pokud jsou množiny strategií jednotlivých hráčů konečné, hovoříme o konečných hrách, je-li množina strategií alespoň jednoho hráče nekonečná, jde o nekonečnou hru<ref name="kos"/>.
Řádek 9:
== Prostor strategií ==
Účastníci hry jsou hráči, každý hráč vybírá optimální strategii ze svého prostoru strategií podle hodnot výplatní funkce. Hráčův prostor strategií tedy definuje, jaké strategie je možné hrát. Předpokládáme, že hráči jsou [[inteligence|inteligentní]] (
hodnotu své výplatní [[funkce (matematika)|funkce]]. Dále předpokládáme, že hráči mají dokonalé [[informace]], tj. že znají množiny hráčů, prostorů strategií i výplatních funkcí <ref name="dlouhy"/>.
Řádek 17:
* Hraju papír
Každý z hráčů má tedy svou množinu přípustných řešení, kterou nazýváme prostorem strategií. Z této množiny volí hráči svoje rozhodnutí
=== Výplatní funkce ===
Pro každého hráče je definována tzv. výplatní funkce, která každé kombinaci strategií hráčů přiřadí velikost výplaty tohoto hráče. Platba neboli výplata hry je výsledek hry jednotlivých hráčů v závislosti na jimi vybraných strategiích.
Pokud uvažujeme hru hranou v normální tvaru, pak budeme rozumět trojici množin <math> \{\{1,2,..,n\},\{S1,..,Sn\},\{Z1,..,Zn\}\}</math>, kde <math> \{1,2,..,n\}</math> je množina hráčů, <math> \{S_1,..,S_n\}</math> je množina prostorů strategií a <math>\{Z_1,..,Z_n\}</math> je množina výplatních funkcí hráčů. Každému hráči <math>i</math> náleží strategie obsažené v příslušném <math> S_i </math>. Strategie je úplný popis jak odehrát hru a každému hráči poskytuje představu o návaznosti na kroky jeho spoluhráčů. Při hraní hry v normálním tvaru si každý hráč zvolí určitou strategii <math> x_i\in S_i </math> a sada všech zvolených strategií (všech hráčů) dává příslušnou hodnotu výplatní funkce <math> Z_i(x_1,..,x_n) </math> pro hráče <math> i
=== Inteligentní hráč ===
Teorie her předpokládá, že si hráč vybírá pouze [[efektivita|efektivní]] strategie. Například ve hře nazvané [[vězňovo dilema]] se předpokládá, že žádný z hráčů se nechce nechat dobrovolně uvěznit. Očekává se, že hráč je konfrontován s určitým počtem situací a dokáže si je seřadit podle svých [[preference|preferencí]] od nejvýhodnější po nejméně výhodnou. Toto seřazení musí být úplné, tj. musí pokrývat všechny situace, a [[tranzitivita|tranzitivní]], tj. pokud dá hráč přednost situaci A před situací B a situaci B před situací C, musí dát přednost situaci A před situací C. Na základě preferencí situací je odvozena užitková funkce (utility function) <ref name="drulak">Drulák, Petr. ''Teorie her: matematika interaktivního rozhodování ''[online].[Cit. 01-10-2008].[http://www.portal.cz/scripts/detail.php?id=2232 Dostupné online]</ref>.
Hráč je inteligentní (racionální) pouze tehdy, pokud maximalizuje hodnotu své výplatní funkce (tj. Naopak hráči, kteří se konfliktu (hry) účastní, ale výsledek hry je nezajímá, jsou nazýváni neinteligentními hráči. Tito hráči ve hře vystupují jako náhodný mechanismus, který ovlivňuje výsledky inteligentních hráčů. Často se pro neinteligentního hráče používá též termín příroda <ref name="kos"/>. Termín Příroda navrhl [[John Harsanyi]] ([[1967]]-[[1968]]), nositel [[Nobelova cena|Nobelovy ceny]] za [[ekonomie|ekonomii]]. Představme si situaci s neúplnou informací, která zvyšuje nutnost uvažování názoru hráče na preference ostatních hráčů, jeho názory na názory ostatních o jeho preferencích, jeho názory o jejich názorech Klasické [[model (abstrakce)| === Konfliktní hra ===
Základním pojmem teorie her je [[konflikt|konfliktní]]
Konfliktní situace může mít charakter:
* [[antagonismus|antagonistický]]
* neantagonistický
V případě antagonistického konfliktu dosažení cíle jedním z účastníků zamezí pozitivnímu výsledku ostatních, úspěch každého z hráčů je možný pouze na úkor úspěšnosti ostatních hráčů.
* Zúčastnit se musí minimálně dva účastníci.
* Každý z účastníků rozhodovací situace zná množinu alternativ svého chování, ale také zná množinu alternativ chování svého protivníka / protivníků.
* Každý z účastníků rozhodovací situace dokáže ocenit efektivnost své volby ve všech možných případech, které by mohly nastat.
* Každý z účastníků rozhodovací situace volí z množných alternativ nezávisle na volbách protivníků <ref name="pytlickova">Pytlíčková, Lenka. ''Elementy teorie her - Bakalářská práce ''[online].[Cit. 15-04-2008].[http://mant.upol.cz/soubory/OdevzdanePrace/B08/b08-05-lp.pdf Dostupné online]
Alespoň jeden účastník rozhodovací situace je inteligentní hráč, tzn. že jeho jednání je uvědomělé a volbou strategie sleduje určitý cíl
=== Optimální strategie ===
Optimální strategie je taková strategie, od níž žádná odchylka nemůže přinést hráči výhody, za předpokladu, že druhý hráč zachová svojí optimální strategii <ref name="roubal">Roubal, Jiří. ''Teorie her ''[online].[Cit. 31-01-2006].[http://support.dce.felk.cvut.cz/pub/roubalj/teaching/ORR/seminars/ORR_cv4_ths.pdf Dostupné online]
U her, které hrají dva inteligentní hráči, je poměrně snadné stanovit optimální strategii, neboť
Například u her s nulovým součtem (se sumou rovnou nule) je [[zisk]] jednoho hráče záporně vzatý „zisk“ druhého hráče. V případě her hraných proti přírodě však nastávají potíže <ref name="kos"/>. Rozlišujeme dvě varianty rozhodování ve hře proti přírodě, které vznikají v antagonistickém konfliktu:
* Rozhodování při [[riziko|riziku]]
* Rozhodování při nejistotě <ref name="roubal"/>.
==== Rozhodování při riziku ====
Jestliže hráč 1 zná (například na základě předchozí zkušenosti)
==== Rozhodování při nejistotě ====
Jestliže však toto rozložení [[pravděpodobnost|pravděpodobností]]
==== Rozhodovací principy ====
V rozhodování o riziku a nejistotě využíváme [[Laplace|Laplaceův]]
* '''Maximinní (pesimistické) kriterium''': Tento princip navrhuje pro jednotlivé možné strategie stanovit nejnižší hodnoty užitku a zvolit takovou strategii, pro kterou je toto minimum maximální. Rozhodovatel tedy předpokládá, že se jej okolní svět bude „snažit“ co nejvíce poškodit.
* '''Maxmaxní (optimistické) kriterium''': Tento princip navrhuje pro jednotlivé možné strategie stanovit nejvyšší hodnoty užitku a zvolit takovou strategii, pro kterou je toto maximum maximální. Rozhodovatel tedy předpokládá, že se mu okolní svět bude „snažit“ co nejvíce pomoci.
* '''Hurwitzovo kritérium''': Jde o konvexní kombinaci optimistického a pesimistického kritéria. Vhodná volba parametru <math>\alpha</math> umožní nastavit vhodný [[kompromis]] mezi oběma krajnostmi – často nepřijatelné
== Ryzí a smíšená strategie ==
Řešením hry v případě her v maticovém stavu může být ryzí nebo smíšená strategie <ref name="brozova">Brožová, Helena. ''Rozhodovací modely a znalostní management ''[online].[http://etext.czu.cz/php/skripta/skriptum.php?titul_key=78 Dostupné online]
=== Ryzí strategie ===
Řešení hry v oboru čistých strategií znamená, že hráč dosáhne svého cíle pouze pomocí jediné své strategie. Ať se hra opakuje (má několik partií) nebo je hrána pouze jedenkrát (má jedinou partii), optimální chování hráče je dáno právě touto jedinou strategií.
Ryzí optimální strategii hráče <math> A</math> budeme značit <math> A_0</math> a tato strategie přinese hráči <math> A</math> maximální výhru, ať již hráč <math> B</math> volí jakoukoli strategii. Ryzí optimální <br /> <br /> <math> M(A_i, B_0) \leq M(A_0, B_0) \leq M(A_0, B_j) </math> <br /> <br /> Lze tedy říci, že jakýkoliv hráč si pohorší, pokud se odkloní od své optimální ryzí strategie. Cena hry <math>(v)</math> je hodnota výplatní funkce <math>M (A_0, B_0 ) </math>. Pokud je cena hry nulová, jedná se o hru spravedlivou, pokud není, jedná se o hru nespravedlivou <ref name="friebelova"/>. První hráč vybírá nejvyšší z nejnižších výher, kterou nazýváme dolní cena hry. Druhý hráč naopak vybírá nejmenší z nejvyšších proher, tento výsledek hry je nazýván horní cena hry. Za předpokladu rovnosti dolní a horní ceny hry je evidentní, že oba hráči nemají lepší volbu strategií. Vyberou-li své strategie jinak, bude jejich výhra menší, resp. prohra větší. Takto vybraná dvojice strategií se nazývá ''sedlovým bodem hry''<ref name="brozova" />. === Sedlový bod ===
[[Soubor:Saddle point.png|
Hledáme-li optimální řešení antagonistického konfliktu hledáme vlastně stabilní řešení, stabilní v tom smyslu, že ani jednomu hráči se nevyplatí od této strategie „utéct“. Tj. má to být takové řešení, aby pokud pouze první hráč změní strategii a druhý hráč zůstane u své strategie, potom si první hráč pohorší. Stejně tak s druhým hráčem. Ze stanovení dolní ceny hry a horní ceny hry vyplývá, že optimální řešení antagonistického konfliktu (v ryzích strategiích) existuje, pokud platí:
<br /> <br /> <math> \begin{matrix} \\ \operatorname{Min} \\ { }^{j} \end{matrix} \ \begin{matrix} \\ \operatorname{Max} \\ { }^{i} \end{matrix} \ a_{ij} =
\begin{matrix} \\ \operatorname{Max} \\ { }^{i} \end{matrix} \
\begin{matrix} \\ \operatorname{Min} \\ { }^{j} \end{matrix} \ a_{ij}
</math>
</math><br /><br />Pokud je tato rovnost splněna, existuje prvek v [[matice|matici]] (hra je hraná v maticovém tvaru), který je nejmenší ve svém řádku a největší ve svém sloupci. Tento prvek nazýváme [[sedlový bod]]. Obecně hra v maticovém tvaru muže mít žádný, jeden nebo více sedlových bodů. Pokud nemá žádný, neexistuje optimální ryzí strategie, pokud má jeden, určuje optimální strategii, pokud jich má více, určuje alternativní optimální (rovnovážné) strategie.<ref name="friebelova"/> Maticová hra má řešení v oboru čistých strategií právě tehdy, když má sedlový bod. Z uvedené věty plyne, že řešit hru v oboru čistých strategií znamená nalézt sedlový bod hry. Odpovídající výhra, resp. prohra je cenou hry. Pokud se sedlový bod hry nepodaří nalézt, hra nemá v oboru čistých strategií řešení <ref name="brozova" />.▼
<br />
<br />
Pokud je tato rovnost splněna, existuje prvek v [[matice|matici]] (hra hraná v maticovém tvaru), který je nejmenší ve svém řádku a největší ve svém sloupci. Tento prvek nazýváme sedlový bod.
Obecně hra v maticovém tvaru muže mít žádný, jeden nebo více sedlových bodů. Pokud nemá žádný, neexistuje optimální ryzí strategie, pokud má jeden, určuje optimální strategii, pokud jich má více, určuje alternativní optimální (rovnovážné) strategie.<ref name="friebelova"/>
▲
=== Smíšená strategie ===
Pokud se nám nepodařilo najít sedlový prvek, znamená to, že dosavadní výklad nebyl dostatečný pro nalezení rovnovážných strategií ve všech možných rozhodovacích situacích, které je možné vyjádřit jako maticovou hru. Lze to vysvětlit na hře kámen-nůžky-papír. Tato hra je hrou dvou hráčů, z nichž každý má k dispozici tři možné strategie. Podle pravidel kámen vyhrává nad nůžkami, nůžky nad papírem a papír nad kamenem. V případě, že oba hráči zvolí stejnou strategii, nastává remíza. V reálné situaci by hráči hru opakovali, od toho však v tomto okamžiku abstrahujeme a považujeme remízu za konečný výsledek hry. Hra kámen, nůžky, papír je hrou s konstantním (nulovým) součtem, která je charakterizována maticí:
<br /> <br /> <math> \begin{pmatrix}0 & +1 & -1 \\-1 & 0 & +1 \\+1 & -1 & 0 \end{pmatrix}</math> <br /> <br /> Je jednoduché si ověřit, že v této matici není možné najít sedlový prvek, takže ani není možné najít Nashovo rovnovážné řešení v ryzích strategiích. Přesto danou hru běžně dohrajeme a známe odpovídající rovnovážnou strategii, která spočívá v náhodném výběru z prostoru strategií. Pro oba hráče je rovnovážnou strategií vektor (1/3; 1/3; 1/3) kde čísla představují pravděpodobnosti, že hráč bude volit první, druhou nebo třetí strategii. Tento typ strategií nazýváme smíšenými (pravděpodobnostními) strategiemi. Také pro tyto strategie platí, že hráč, který se od rovnovážné strategie odchýlí (zvolí jiné pravděpodobnosti), nemůže nic získat, ale naopak může ztratit. Pokud maticová hra nemá řešení v ryzích strategiích, použijeme tzv. smíšeného rozšíření maticové hry. Prostory strategií nyní budou představovat vektory pravděpodobnosti, s jakou hráči zvolí jednotlivé strategie. Ryzí strategie jsou tedy zvláštním případem ( * Každá maticová hra má Nashovo rovnovážné řešení ve smíšených strategiích <ref name="dlouhy"/>.
Řádek 90 ⟶ 119:
* [[John Forbes Nash|John Nash]]
* [[Equilibrium (ekonomika)|Equilibrium]]
* [[
* [[No-win situation]]
* [[Dominantní strategie]]
=== Externí odkazy ===
* {{Cs}} [http://psh.ntkcz.cz/skos/PSH11427/html/cs Rozcestník k nalezení materiálů o teorii her ]
* {{en}} [http://stanford.library.usyd.edu.au/entries/game-theory/ Podrobné informace o teorii her]
[[Kategorie:Teorie her]]
|