Kaj je nazaj indukcija?
Indukcija za nazaj v teoriji iger je iterativni postopek sklepanja nazaj v času, od konca težave ali situacije, za reševanje končno obsežne oblike in zaporednih iger ter sklepa na zaporedje optimalnih dejanj.
Pojasnjena nazaj indukcija
Povratna indukcija se uporablja za reševanje iger, odkar sta John von Neumann in Oskar Morgenstern ustanovila teorijo iger kot akademski predmet, ko sta leta 1944 izdala svojo knjigo Teorija iger in ekonomsko vedenje .
Na vsaki stopnji igre povratna indukcija določa optimalno strategijo igralca, ki naredi zadnji korak v igri. Nato se določi optimalno dejanje igralca, ki se giblje od naslednjega do zadnjega, pri čemer upoštevamo dejanje zadnjega igralca. Ta postopek se nadaljuje nazaj, dokler ni določen najboljši ukrep za vsako časovno obdobje. Učinkovito je določanje Nash-ovega ravnovesja vsake podgame izvirne igre.
Vendar pa rezultati, ki izhajajo iz vzvratne indukcije, pogosto ne napovedujejo dejanske človeške igre. Eksperimentalne študije so pokazale, da je »racionalno« vedenje (kot ga predvideva teorija iger) v resničnem življenju le redko prikazano. Neracionalni igralci lahko dejansko dobijo višje izplačila, kot je napovedano z vzvratno indukcijo, kot je prikazano v igri centipede.
V igri s stotinami dva igralca izmenično dobita priložnost, da prevzameta večji delež naraščajočega lonca denarja ali data pot drugemu igralcu. Izplačila so razporejena tako, da če se pot poda nasprotniku in nasprotnik prevzame pot v naslednjem krogu, prejme nekoliko manj, kot če bi ga v tem krogu prevzel. Igra se zaključi takoj, ko igralec zasede, pri čemer igralec dobi večji del, drugi igralec pa manjši.
Primer indukcije nazaj
Kot primer, predpostavimo, da je igralec A na prvem mestu in se mora odločiti, ali bo "vzel" ali "prenesel" zalog, ki trenutno znaša 2 USD. Če vzame, potem A in B dobita vsak po 1 dolar, če pa A preide, mora igralec B. sprejeti odločitev, da bo sprejel ali prenesel, če bo B prevzel, dobi 3 $ (tj. Prejšnji znesek 2 $ + 1 $) in A dobi 0 USD. Če pa B preide, se A zdaj odloči, ali bo šel ali mimo in tako naprej. Če se oba igralca vedno odločita za prehod, vsak ob koncu igre prejme izplačilo v višini 100 USD.
Poanta igre je, če A in B sodelujeta in nadaljujeta do konca igre, dobivata vsak najvišji znesek v višini 100 USD. Če pa zaupajo drugemu igralcu in pričakujejo, da jih bo ob prvi priložnosti "prevzel", Nash ravnovesje napoveduje, da bodo igralci vzeli najnižjo možno škodo (v tem primeru 1 dolar).
Nash-ovo ravnotežje v tej igri, kjer noben igralec po premisleku o nasprotnikovi izbiri nima nobene spodbude, da odstopi od svoje izbrane strategije, nakazuje, da bi prvi igralec vzel pot v prvem krogu igre. Vendar v resnici to stori razmeroma malo igralcev. Posledično dobijo večji izplačilo od tistega, ki ga napoveduje analiza ravnotežja.
Reševanje zaporednih iger z uporabo nazaj indukcije
Spodaj je preprosta zaporedna igra med dvema igralcema. Oznake z igralcem 1 in predvajalnikom 2 v njih so nabor informacij za igralce oz. Številke v oklepajih na dnu drevesa so izplačila na vsaki točki. Igra je tudi zaporedna, zato igralec 1 sprejme prvo odločitev (levo ali desno), igralec 2 pa svojo odločitev po igralcu 1 (gor ali dol).
Slika 1
Vzvratna indukcija, tako kot vsa teorija iger, uporablja predpostavke o racionalnosti in maksimizaciji, kar pomeni, da bo Player 2 v vsaki dani situaciji maksimiral svoj izplačilo. Na obeh informacijah imamo na voljo dve možnosti, štiri. Z odpravo možnosti, ki jih Player 2 ne bo izbral, lahko drevo zožimo. Na ta način bomo v podanem naboru informacij krepili črte, ki maksimirajo plačilo igralca.
Slika 2
Po tem znižanju lahko Player 1 poveča svoje izplačila zdaj, ko so odločitve o igralcu 2 objavljene. Rezultat je ravnotežje, ki ga najdemo z vzvratno indukcijo igralca 1, ki izbere "pravilno" in igralca 2, ki izbere "gor". Spodaj je rešitev igre s krepko ravnotežno potjo.
Slika 3
Na primer, preprosto bi lahko postavili igro, podobno zgornji, pri čemer bi uporabljali podjetja kot igralce. Ta igra lahko vključuje scenarije izdaje izdelkov. Če bi podjetje 1 želelo izdati izdelek, kaj bi podjetje 2 lahko odgovorilo? Ali bo podjetje 2 izdalo podoben konkurenčni izdelek? Z napovedovanjem prodaje tega novega izdelka v različnih scenarijih lahko nastavimo igro, ki napoveduje, kako se lahko dogodki odvijajo. Spodaj je primer, kako bi si lahko zamislili takšno igro.
Slika 4
