Operantní podmiňování: Porovnání verzí

Smazaný obsah Přidaný obsah
oprava dle WP:WCW
Honya (diskuse | příspěvky)
Úpravy úpravy, přidání obrázků, wikifi, šablony na citace..
Řádek 1:
'''Operantní podmiňování''' (někdy též '''učení úspěchem''') je druh učení, při kterém se mění pravděpodobnost výskytu spontánních aktů [[chování]] (operantů), na základě jejich důsledků (odměňování, trestání).
[[Soubor:Skinner boxes 01.jpg|thumb|Moderní Skinnerovy boxy v laboratoři Brazilské univerzity.]]
 
==Dějinný nástin vzniku==
Americký [[psycholog]] a neobehaviorista [[Burrhus Frederic Skinner]] ([[1904]] - [[1990]]) při svých proslulých pokusech poukázal na to, jak výrazně odměna mění a formuje chování. Se svými [[Skinnerův box|boxy]], demonstroval pozitivní a negativní posílení a v samém důsledku zpochybnil existenci svobodné vůle. Striktně se držel behaviorálního S – R přístupu a svými utopickými myšlenkami uspořádání společnosti (Walden two 1948), vyvolával zájem a pozdvižení. Ve své práci vycházel z poznatků [[Ivan Petrovič Pavlov|Ivana Petroviče Pavlova]] o [[klasické podmiňování|klasickém podmiňování]]. Dále ho výrazně ovlivnila práce zakladatelů behaviorismu [[J. B. Watson|J. B. Watsona]] a [[Edward Lee Thorndik|Edwarda L. Thorndika]], na jehož [[instrumentální podmiňování|instrumentálním podmiňování]] vytvořil podmiňování operantní. To je podle Skinnera druh učení, který je daleko bližší běžnému životu, než klasické podmiňování. Výsledky své práce shrnul B. F. Skinner ve dvou základních pracích: ''Behavior of Organism 1938'' a ''Science and Human Behavior 1953''.
 
==Princip a základní pojmy==
Řádek 10:
B. F. Skinner rozlišil dva druhy důsledků chování z nichž posilování, dále dělí na pozitivní a negativní:
 
* '''posíleníPosílení (zpevnění)''' - kladný důsledek chování zvyšující pravděpodobnost budoucího výskytu chování (operantu) .
** '''pozitivníPozitivní posílení (zpevnění)''' - proces, při kterém je určité chování odměněno něčím pozitivním, příjemným .
** '''negativníNegativní posílení (zpevnění)''' - jde o chování, které je posilováno a tím i více opakováno, jako důsledek potřeby vyhnout se nepříjemným podnětům (př. otevření okna v přetopené místnosti).
* '''trestTrest''' - negativní, záporný důsledek, který snižuje pravděpodobnost budoucího výskytu chování.
 
===Procesy provázející operantní podmiňování===
 
'''Osvojení operantní reakce''' - z počátku, kdy jedinec ještě nedokáže dokonale provést daný operant, by měla být odměněna, každá žádoucí reakce (viz. [[#Tvarování (shaping, postupná aproximace)|tvarování]]). Po osvojení to už není nezbytně nutné. Zpevnění (odměnou) by mělo následovat bezprostředně po operantním chování a mělo by být takového druhu, aby bylo pro danou osobu opravdu cenné. Jinak budeme odměňovat laboratorního [[Potkan|potkana]] a jinak dospělého člověka ([[dar]], pochvala, potrava, pohlazení).
 
'''Generalizace a diskriminace podnětů''' - při pokusech se zvířaty, byla podmínka sešlápnutí pedálu rozšířena o akustický signál (''diskriminační podnět''). Potrava tak byla dodána pouze tehdy, když potkan sešlápl pedál při zvukovém signálu. Nenechal se však zmást změnou výšky tónu signálu, a nadále správně prováděl operant při zaznění i zkresleného tónu. Došlo k takzvané generalizaci podnětu.
    Diskriminační učení se u lidí projevuje například zvýšeným pracovním nasazením (operantu) v přítomnosti nadřízeného. Generalizace se v tomto případě může projevit například tak, že pokud se objeví osoba, která se nadřízenému podobná, dojde alespoň po určitou dobu ke zvýšení výkonnosti také. U známého Watsonova experimentu malý Albert, došlo ke generalizaci přítomnosti živého potkana. Úzkost tak vyvolávala třeba i plyšová hračka a pod.
 
    Diskriminační učení se u lidí projevuje například zvýšeným pracovním nasazením (operantu) v přítomnosti nadřízeného. Generalizace se v tomto případě může projevit například tak, že pokud se objeví osoba, která se nadřízenému podobná, dojde alespoň po určitou dobu ke zvýšení výkonnosti také. U známého Watsonova experimentu [[Malý Albert|malý Albert]], došlo ke generalizaci přítomnosti živého potkana. Úzkost tak vyvolávala třeba i plyšová hračka a podapod.
'''Vyhasínání a spontánní obnovení''' - v dalších pokusech bylo zjištěno, že operantní chování po určitém počtu neodměněných pokusů přestane laboratorní potkan provádět, tedy vyhasne. Pokud ho ovšem další den do Skinnerova boxu vrátíme, opět několik pokusů operantního chování provede. Naučené operantní chování se obnoví.
 
    U lidí se s vyhasnutím můžeme setkat například u vztekajících se dětí, kterým rodiče v tomto případě nevěnují pozornost. Po nějaké době, dítě zjistí, že svým křikem změnu situace nevyvolá a přestane. Podobně, ignoruje-li učitel u žáků některé drobné přestupky nekázně, pak postupně slábnou nebo úplně vymizí.
'''Vyhasínání a spontánní obnovení''' - v dalších pokusech bylo zjištěno, že operantní chování po určitém počtu neodměněných pokusů přestane laboratorní potkan provádět, tedy ''vyhasne''. Pokud ho ovšem další den do Skinnerova boxu vrátíme, opět několik pokusů operantního chování provede. Naučené operantní chování se obnoví.
 
    U lidí se s vyhasnutím můžeme setkat například u vztekajících se dětí, kterým rodiče v tomto případě nevěnují pozornost. Po nějaké době, dítě zjistí, že svým křikem změnu situace nevyvolá a přestane. Podobně, ignoruje-li učitel u žáků některé drobné přestupky nekázně, pak postupně slábnou nebo úplně vymizí.
 
==Pozitivní posílení (zpevnění)==
Řádek 32 ⟶ 34:
 
'''Posilování podle stálého časového intervalu (fixed intervat FI)''' - přísun odměny zde nezávisí pouze na operantu, ale také na době, která uplynula od minulého odměnění. To zákonitě vede ke zvyšování frekvence operantů s blížícím se koncem časového intervalu.
 
    S tímto druhem posilování se můžeme setkat třeba v politice, kde jsou na začátku funkčního období prováděna nepopulární opatření a s jeho blížícím se koncem jsou prováděna opatření populární až populisticképopulistická.
 
'''Posilování podle proměnlivého časového intervalu (variable interval VI)''' - při tomto posilování jsou odměňovány úkony, které se objevují po náhodně dlouhém intervalu. Tento způsob není příliš efektivní při učení. Na druhou stranu, pokud má osoba již operant vštípený, posilování podle proměnlivého časového intervalu vede k relativně stabilnímu výskytu požadovaného chování.
 
    S tímto způsobem posilování se můžeme setkat například při chválení dobrého chování dětí, rodiči. Bylo prokázáno, že náhodné zpevnění dokáže udržet "dobré mravy" v repertoáru chování dospělého natrvalo. Ale pokud tento druh posílení použijeme k zlepšení výkonů zaměstnance, který podává stabilní relativně neměnné výkony, neuspějeme.
 
'''Posilování ve stálém poměru k počtu operantů (fixed rate FR)''' - posilování (odměna) zde následuje pravidelně po daném počtu operantů (1:2, 1:5, 1:20 a pod.). Vede k velkému počtu stabilně prováděných operantů.
    U lidí se s tímto způsobem posilování můžeme setkat například při výkupu ovoce na brigádě. Pokud pracovník dostane za 10kg jablek 100Kč bude pracovní výkonnost relativně vysoká.
 
    U lidí se s tímto způsobem posilování můžeme setkat například při výkupu ovoce na brigádě. Pokud pracovník dostane za 10kg jablek 100Kč bude pracovní výkonnost relativně vysoká.
'''Posilování v nepravidelném (náhodném) poměru k počtu reakcí (variable ratio VR)''' - odměny při tomto druhu posilování následují po různém počtu operantů. Poměr odměn k výskytu operantů se s každou reakcí mění (1:4, 1:9, 1:1 etc.). Jedinec si tak nikdy není jistý, kdy dojde k dalšímu posílení a jen obtížně zaznamená, že bylo posilování zcela ukončeno. V tom spočívá vysoká efektivita tohoto způsobu a může vést až k závislosti. Jedinec je totiž dlouho ponechán v nejistotě a naději, že přijde další odměna, pro kterou je ochoten provést veliký počet požadovaných operantů.
    U lidí se s posilováním v náhodném poměru k počtu operantů můžeme setkat například u výherních automatů a dalších hazardních her, jako je internetový poker. Dá se jím vysvětlit jejich návykovost.
 
'''Posilování v nepravidelném (náhodném) poměru k počtu reakcí (variable ratio VR)''' - odměny při tomto druhu posilování následují po různém počtu operantů. Poměr odměn k výskytu operantů se s každou reakcí mění (1:4, 1:9, 1:1 etc.). Jedinec si tak nikdy není jistý, kdy dojde k dalšímu posílení a jen obtížně zaznamená, že bylo posilování zcela ukončeno. V tom spočívá vysoká efektivita tohoto způsobu a může vést až k [[Závislost|závislosti]]. Jedinec je totiž dlouho ponechán v nejistotě a naději, že přijde další odměna, pro kterou je ochoten provést veliký počet požadovaných operantů.
===Pověrčivé chování===
 
    U lidí se s posilováním v náhodném poměru k počtu operantů můžeme setkat například u výherních[[Hrací automat|hracích automatů]] a dalších hazardních her, jako je internetový poker. Dá se jím vysvětlit jejich návykovost.
 
===Pověrčivé chování===
[[Soubor:Feral pigeon about to land-8.jpg|thumb|Skinner používal pro své pokusy, mimo jiné, i holuby.]]
[[Burrhus Frederic Skinner|B. F. Skinner]] provedl sérii pokusů, při kterých byli holubi v boxu odměňováni nezávisle na jejich chování, každých 15 sekund. Ti s každou odměnou stále více opakovali operanty, které prováděli bezprostředně před tím, než do krmítka spadla potrava. Někteří tak stále opakovali chování jako kývání hlavou nahoru a dolů, otáčení hlavou dopředu, dozadu a nebo se celí otáčeli dokolečka. Skinner toto chování označil za pověrčivé. Osoby se jím snaží přivolat úspěch, ačkoliv spolu jejich chování a následná odměna nijak nesouvisí.
 
    Při pověrčivém chování si lidé sami vytvoří diskriminační podnět, nebo opakují operanty o kterých se domnívají, že přinesou úspěch. Prvky náhodného posilování zřejmě zapříčiňují, že se člověk pověrčivého chování drží a jen těžko zbavuje. Příkladem jsou [[Talisman|talismany]], [[Pověra|pověry]] (zaťukávání) a podapod.
 
===Efekt kontrastu===
 
Začnou-li laboratorní zvířata dostávat za operant větší odměnu, než doposavad zvýší přirozeně svůj výkon a frekvenci vykonávání. Podobně při snížení dávky odměny, se jejich výkon sníží.
 
    U lidí se s tímto efektem můžeme setkat v zaměstnání, kde postupné zvyšování odměn, vede ke zvýšení výkonu. Důležitý a rozhodující je rozdíl s původní odměnou, která určuje naše očekávání. Dobrým příkladem je citace z filmu [[Když Harry potkal Sally]]: ''Nenavykněte partnera na začátku vztahu na to, že jej pokaždé doprovodíte na letiště. Jakmile s tím přestanete, bude vám to vyčítat.''
 
===Tvarování (shaping, postupná aproximace)===
 
Tvarování (shaping), je specifický druh pozitivního posílení. Při klasickém kladném posílení je vždy odměněn zcela splněný operant, u tvarování následuje odměna i po dílčích úspěších. Výhoda tvarování tkví v tom, že lze subjekt naučit zcela novým prvkům chování. To se postupně posunuje a formuje směrem k cíli, který může představovat relativně složité úkony.
 
    U lidí se tvarování využívá například při vyučování nejrůznějších pohybových dovedností. [[Lyžování|Lyžařský]] instruktor odměňuje dílčí úspěchy svého žáka, stejně jako rodiče, kteří ze začátku ocení i nedokonale uklizený podoj svého potomka. V programech pro mentálně retardované se principy tvarování využívají při nácviku běžných denních dovedností. U lidí je tvarování složitější, kvůli individuální hodnotě odměny (sociální, fyzické, psychické).
    B. F. Skinner demonstroval účinek posilování na experimentu s holuby, které naučil hrát hru s míčkem. Je jasné, že v přirozeném repertoáru chování holubů tyto operanty nejsou a tak nebylo možné čekat až na výsledé chování, to by nikdy nepřišlo. Místo toho bylo nejprve posilováno přiblížení se k míčku jedním holubem. Pokud to zvládl, byl odměňován pouze, když klovl do míčku a poté pouze když posunul míček směrem k druhému konci stolu. Podobně byl vycvičen i druhý holub. Pak už stačilo odměňovat společnou souhru obou holubů.<ref>*FRAŇKOVÁ, Slávka; BIČÍK, Vítězslav. Srovnávací psychologie a základy etologie. Praha : Karolinum, 1999. s. 148 ISBN 80-7184-835-2.</ref> Skinnerovi následovníci, později naučili králíka, aby vzal do tlamy minci a vhodil jí do kasičky ve tvaru prasátka. I dnes se tvarování používá, například při specifickém výcviku psů a pod.
 
    B. F. Skinner demonstroval účinek posilování na experimentu s [[Holub domácí|holuby]], které naučil hrát hru s míčkem připomínající [[ping pong]]. Je jasné, že v přirozeném repertoáru chování holubů tyto operanty nejsou a tak nebylo možné čekat až na výsledé chování, - to by nikdy nepřišlo. Místo toho bylo nejprve posilováno přiblížení se k míčku jedním holubem. Pokud to zvládl, byl odměňován pouze, když klovl do míčku a poté pouze když posunul míček směrem k druhému konci stolu. Podobně byl vycvičen i druhý holub. Pak už stačilo odměňovat společnou souhru obou holubů.<ref>*FRAŇKOVÁ,{{Citace monografie | příjmení = Fraňková | jméno = Slávka; BIČÍK,| příjmení2 = Bičík | jméno2 = Vítězslav. | titul =Srovnávací psychologie a základy etologie. Praha| :vydavatel = Karolinum, | místo = Praha | rok = 1999. s.| 148isbn = ISBN 80-7184-835-2. | strany = 148 }}</ref> Skinnerovi následovníci, později naučili králíka, aby vzal do tlamy minci a vhodil jí do kasičky ve tvaru prasátka. I dnes se tvarování používá, například při specifickém výcviku psů a podapod.
 
 
Řádek 63 ⟶ 73:
 
Jde o důsledek odstranění nebo zmírnění nepříjemných pocitů. Zpevňují se tak operanty, díky kterým nepříjemné podněty vůbec nemusejí začít působit. Negativní posílení vede ke zvýšení frekvence tohoto ulehčujícího chování.
 
    V běžném životě se s negativním posílením můžeme setkat, například pokud půjdeme za příliš hlučným sousedem a asertivně ho požádáme, aby nedělal hluk. Pokud naše jednání povede k úspěchu, bude posíleno. Tento druh zpevnění se podílí na vzniku některých závislostí, pokud například [[Alkohol|alkoholem]] úspěšně odstraníme svou nervozitu, třeba před veřejným vystoupením, bude použití pití, jako léku na úzkost posíleno. Podobně může vzniknout závislost na prášcích proti bolestí hlavy na spaní a podapod. S negativním posílením se můžeme často setkat v [[Reklama|reklamě]], kde nějaký produkt, zázračně odstraní nepříjemné pocity.
    Záporné zpevňování často vede k vyhýbavému chování i v situacích, kdy je žádoucí problému čelit. Je velmi účinné takže učení probíhá snadno a velice obtížně zažité operanty vyhasínají. Jedinec se tak často uchyluje k zajetému chování, ačkoliv se situace, po které obvykle následovaly nepříjemné pocity, změnila. Negativní posílení se podílí na vzniku poruch chování jako je obsedantně kompulzivní porucha.
 
    Záporné zpevňování často vede k vyhýbavému chování i v situacích, kdy je žádoucí problému čelit. Je velmi účinné takže učení probíhá snadno a velice obtížně zažité operanty vyhasínají. Jedinec se tak často uchyluje k zajetému chování, ačkoliv se situace, po které obvykle následovaly nepříjemné pocity, změnila. Negativní posílení se podílí na vzniku poruch chování, jako je [[obsedantně kompulzivní porucha]].
 
===Podmiňování úniku a vyhýbavého chování===
 
'''Podmiňování úniku''' - jde o posilování operantu, díky němuž se podařilo uniknout nepříjemnému pocitu. Například pokud je na [[Koupaliště|koupališti]] příliš velké horko, přesuneme svou deku do stínu. Podobně chlapec, který se rozbrečí poté co ho rodiče za trest poslali do svého pokoje a který si tímto chováním vymůže obměkčení rodičů, posílí v sobě tuto možnost úniku před trestem.
 
'''Podmiňování vyhýbavého chování''' - jde o posilování chování, díky kterému se do nepříjemné situace jedinec vůbec nedostane. Jde o jakési předcházení možným nepříjemnostem. Například, je-li víno zakalené nebudeme ho pít, nemáme-li někoho rádi, budeme se mu vyhýbat, máme-li špatné zkušenosti s partnerskými vztahy budeme se jim spíše vyhýbat.
 
    Toto posilování se podílí na vzniku tzv. ''sekundárního zisku z nemoci''. Tím je myšlen zisk z výjimečného postavení, které nemocný díky nemoci získá. Jeho okolí se k němu chová pozorněji a s větší ochotou pomáhá řešit problémy běžného života, které si jinak nemocný řeší sám.
Podmiňování vyhýbavého chování - jde o posilování chování, díky kterému se do nepříjemné situace jedinec vůbec nedostane. Jde o jakési předcházení možným nepříjemnostem. Například, je-li víno zakalené nebudeme ho pít, nemáme-li někoho rádi, budeme se mu vyhýbat, máme-li špatné zkušenosti s partnerskými vztahy budeme se jim spíše vyhýbat.
    Toto posilování se podílí na vzniku tzv. sekundárního zisku z nemoci. Tím je myšlen zisk z výjimečného postavení, které nemocný díky nemoci získá. Jeho okolí se k němu chová pozorněji a s větší ochotou pomáhá řešit problémy běžného života, které si jinak nemocný řeší sám.
 
==Trest==
Řádek 78 ⟶ 91:
 
Existují dva druhy trestů:
*'''Působení nepříjemného (averzivního) podnětu''' - jde o bolestivé tresty, nadávky, nepřiměřenou kritiku, ponižování a podapod.
*'''Zastavení působení příjemných podnětů''' - jde o trest v podobě omezení nebo celkového odstranění působení příjemných podnětů. V praxi se může jednat o zákaz hraní si na počítači, zákaz účasti na společenské akci, odepření slibovaného dárku, ztrátaodepření lásky a náklonnosti a podapod.
 
    Zejména averzivní chování může být doprovázeno těmito nežádoucími účinky:
*Bolestivé tělesné tresty vyvolávají nenávist k trestajícímu, která se později může projevit jinde
nepřiměřeně tvrdý trest může vést nepřiměřenému [[Strach|strachu]] až k [[úzkost|úzkosti]].
*Trest může mít generalizovaný inhibiční efekt, pokud tak dítěti budeme ustavičně vtloukat do hlavy aby neodmlouvalo, může s námi zcela přestat mluvit. Diskriminační procesy zas zapříčiní účinnost trestu jen v přítomnosti trestající osoby.
*Trestání se pro trestajícího může stát odměnou v podobě rychlé změny neposlušnosti druhých, směrem k požadovanému chování.
*Některé tresty jako například veřejná kritika v sobě zahrnují i prvky pozitivního posilování (rebelie, pozornost všech zúčastněných), což může paradoxně vést k zvýšení nežádoucího chování. Kritika, tak může pro samotného kritika představovat past.
*Trestající rodiče nedávají příliš dobrý vzor toho, jak by se měli řešit problémy. Podporují ve svých potomcích stejný způsob chování.
Řádek 99 ⟶ 112:
 
==Literatura==
 
*PLHÁKOVÁ, Alena. Učebnice obecné psychologie. Praha : Academia, 2004. 472 s. ISBN 80-200-1086-6.
*{{Citace monografie | příjmení = Plháková | jméno = Alena | titul = Učebnice obecné psychologie | vydavatel = Academia | místo = Praha | rok = 2004 | isbn = 80-200-1086-6 }}
*PLHÁKOVÁ, Alena. Dějiny psychologie. Praha : Grada, 2006. 328 s. ISBN 80-247-0871-X.
*{{Citace monografie | příjmení = Plháková | jméno = Alena | titul = Dějiny psychologie | vydavatel = Grada | místo = Praha | rok = 2006 | isbn = 80-247-0871-X }}
*HOSKOVEC, Jiří; NAKONEČNÝ, Milan; SEDLÁKOVÁ, Miluše. Psychologie XX. století. Praha : Karolinum, 2002. 296 s. ISBN 80-246-0300-4.
*{{Citace monografie | příjmení = Hoskovec | jméno = Jiří | příjmení2 = Nakonečný | jméno2 = Milan | příjmení3 = Sedláková | jméno3 = Miluše | titul = Psychologie XX. století | vydavatel = Karolinum | místo = Praha | rok = 2002 | isbn = 80-246-0300-4 }}
*FRAŇKOVÁ, Slávka; BIČÍK, Vítězslav. Srovnávací psychologie a základy etologie. Praha : Karolinum, 1999. 296 s. ISBN 80-7184-835-2.
*{{Citace monografie | příjmení = Fraňková | jméno = Slávka | příjmení2 = Bičík | jméno2 = Vítězslav | titul =Srovnávací psychologie a základy etologie | vydavatel = Karolinum | místo = Praha | rok = 1999 | isbn = ISBN 80-7184-835-2 }}
*SLATER,{{Citace monografie | příjmení = Slater | jméno = Lauren. | titul = Pandořina skříňka. Praha:| vydavatel = Dokořán ; Argo, | místo = Praha | rok = 2008. 304| s.isbn ISBN= 978-80-7203-985-2, | isbn2 = 978-80-7363-090-4 }}