Albert-spillet

Her kan brukere av forum utfordre hverandre med morsomme oppgaver og nøtter man ønsker å dele med andre. Dette er altså ikke et sted for desperate skrik om hjelp, de kan man poste i de andre forumene, men et sted for problemløsing på tvers av trinn og fag.

Moderatorer: Vektormannen, espen180, Aleks855, Solar Plexsus, Gustav, Nebuchadnezzar, Janhaa

Svar
mrcreosote
Guru
Guru
Innlegg: 1995
Registrert: 10/10-2006 20:58

Dette er en litt annerledes oppgave. Den krever ikke noen spesielle matematiske kunnskaper, men det er klart at det hjelper med en viss logisk sans.

Du spillet et spill med Albert. Albert er en ganske smart fyr, så han kommer nok til å spille veldig bra.

Spillet går som følger: Dere har begge et kronestykke og en femmer. Uten at den andre ser det velger dere en av disse myntene og gjemmer i hånda. Deretter blir det avslørt hva dere valgte og vinneren får de to myntene som var i spill. Hvis dere hadde det samme vinner Albert, hvis dere ikke hadde det samme vinner du. Vinneren vil altså tjene enten en eller fem kroner.

Dere spiller veldig mange ganger. Hvordan ville du spilt for å tjene mest mulig?

Noen tilleggsspørsmål å tenke på:
Hvordan kommer Albert til å spille?
Hvis du får tilbud om å bytte rolle med Albert, altså endre reglene sånn at det er du som vinner ved like mynter, ville du gjort det da?
Hvor mye kan du regne med å tjene/tape per spill i lengden?
KjetilEn
Dirichlet
Dirichlet
Innlegg: 191
Registrert: 28/02-2007 17:30
Sted: Oslo

mrcreosote skrev: Dere spiller veldig mange ganger. Hvordan ville du spilt for å tjene mest mulig?
Valgt 1 kr oftere. Siden dette gir høy gevinst med lav risiko. (dog kan sies at jeg vet at Albert er smart og vet at han vet at det er best for meg å spille 1 kr ofte, så derfor spiller jeg 5 kr)
mrcreosote skrev: Hvordan kommer Albert til å spille?
Gevinsten hans er like stor som risikoen. Men siden han vet det er bedre for motspilleren å velge 1 kr, vil han velge dette oftere.
mrcreosote skrev: Hvis du får tilbud om å bytte rolle med Albert, altså endre reglene sånn at det er du som vinner ved like mynter, ville du gjort det da?
Nei (men jeg kunne gjerne endret reglene slik at jeg var smart og Albert ikke var det).
mrcreosote skrev: Hvor mye kan du regne med å tjene/tape per spill i lengden?
Ingenting


Vet ikke om jeg ble så mye smartere etter dette :)
Those who know a lot, don't know more about how much they know than those who know less.
sEirik
Guru
Guru
Innlegg: 1551
Registrert: 12/06-2006 21:30
Sted: Oslo

Enig med KjetilEn.

Bare en liten digresjon... kunne det være mulig å løse denne oppgaven med numeriske metoder? Hvis man lot en datamaskin spille mot seg selv, og på en måte lære av sine egne feil?
mrcreosote
Guru
Guru
Innlegg: 1995
Registrert: 10/10-2006 20:58

Dere har noe rett og noe galt i deres gjett på hvordan det skal spilles. Jeg vil ikke røpe for mye ennå, men oppfordrer heller folk til å komme med tanker omkring spillet.

Det hadde vært fint om du laga et program, Eirik (eller andre), og posta resultater her. Prøv eventuelt å spille med familie og venner og se hvor rike dere blir.

Kjetil: Siden du mener du går i null i lengden, antar jeg det er likegyldig for deg om du bytter plass med Albert?
sEirik
Guru
Guru
Innlegg: 1551
Registrert: 12/06-2006 21:30
Sted: Oslo

Noen flere tanker:

Albert er veldig god, så vi kan si at han spiller med teknikken vi kaller "best play". Vi vil også finne vår egen "best play", gitt de reglene som er beskrevet.
Her er hele hendelsesrommet for ett spill:

Albert 1, Vi 1 - Vi får -1 kr
Albert 1, Vi 5 - Vi får 1 kr
Albert 5, Vi 1 - Vi får 5 kr
Albert 5, Vi 5 - Vi får -5 kr

Sett at Albert spilte som en ape - valgte 1 i 50 % av tilfellene og 5 i 50 % i tilfellene. Ved å spille 1 ville vi da fått i gjennomsnitt [tex]\frac{5 + (-1)}{2} = 2[/tex] kr. pr spill. Ved å spille 5 ville vi fått i gjennomsnitt [tex]\frac{1 + (-5)}{2} = -2[/tex] kr. pr spill. Det er altså klart at hvis vi spilte mot Albert når han brukte ape-strategien, ville det være best å velge 1 hele tiden. Men siden Albert er ganske smart, kan det tenkes at han vil velge 1 oftere enn 5, siden han da vil vinne oftere hvis vi velger 1 hele tiden. Vi kan ikke velge 1 absolutt hele tiden, for da vil Albert bare velge 1 hele tiden han og, så vil han vinne hele tiden. Så vi bør velge 1 mellom 50 % og 100 % av gangene.

Hva om vi generaliserer, litt og lar strategiene være slik:
Albert velger 1 i andelen p av tilfellene (Det er p sannsynlighet for at Albert velger 1)
Vi velger 1 i andelen q av tilfellene (Det er q sannsynlighet for at vi velger 1)

Da er utfallsrommene:

Albert 1, Vi 1 (med sannsynlighet [tex]pq[/tex])
Albert 1, Vi 5 (med sannsynlighet [tex]p(1-q) = p - pq[/tex]
Albert 5, Vi 1 (med sannsynlighet [tex](1-p)q = q - pq[/tex]
Albert 5, Vi 5 (med sannsynlighet [tex](1-p)(1-q) = 1 - p - q + pq[/tex])

Da kan vi la X være en stokastisk variabel, som angir hvor mange kr vi kommer til å vinne på ett spill. Vi kan finne forventningsverdien til X:

[tex]E(X) = -1 \cdot (pq) +1 \cdot (p - pq) + 5 \cdot (q-pq) + (-5) \cdot (1 - p - q + pq)[/tex]

[tex]E(X) = p - pq - pq + 5(q - pq - 1 + p + q -pq)[/tex]

[tex]E(X) = p - 2pq + 5q - 5pq - 5 + 5p + 5q - 5pq[/tex]

[tex]E(X) = 6p + 10q - 12pq - 5[/tex]

Vi kan forvente at Albert ønsker å velge p slik at E(X) blir lavest mulig, mens vi ønsker å velge q slik at E(X) blir høyest mulig.

Vi tenker oss at Albert setter p = 0.5 - etter apestrategien. Da vil vi ha E(X) høyest mulig ved å velge riktig q. Vi deriverer E(X) og får

[tex]\frac{\rm d}{{\rm d}q}E(X) = 10 - 12p[/tex]

Vi ser at hvis [tex]p > \frac{5}{6}[/tex] så er [tex]\frac{{\rm d}}{{\rm d}q} E(X) < 0[/tex]. Da er det best å velge lavest mulig q.
Hvis ikke, er det best å velge høyest mulig q.
I dette tilfellet bør vi velge høyest mulig q, siden [tex]p < \frac{5}{6}[/tex]. Vi velger derfor q = 1. Det tilsier at vi bør spille 1 hele tiden (Dette fant vi også frem til i stad.)

Vi lar nå Albert endre sin strategi. Han vil finne en p slik at E(X) blir lavest mulig. Ved å derivere E(X) får vi

[tex]\frac{\rm d}{{\rm d}p} E(X) = 6 - 12q[/tex]

Vi ser at hvis [tex]q > \frac{1}{2}[/tex] er [tex]\frac{\rm d}{{\rm d}p} E(X) < 0[/tex]. Da bør Albert velge høyest mulig p-verdi. I dette tilfellet er [tex]q > \frac{1}{2}[/tex] og Albert bør derfor velge høyest mulig p-verdi. Da velger han p = 1.

Da velger vi q = 0. Og da velger Albert p = 0. Så vi velger q = 1. Og Albert velger p = 1. Vi velger q = 0. Og så videre.

Men sett nå at Albert setter [tex]p = \frac{5}{6}[/tex]. Da går det for det samme hvilken verdi vi velger for q. Da er E(X) = 0. Hvis vi setter [tex]q = \frac{1}{2}[/tex], går det for det samme hva Albert velger for p.

Dette tyder på at Albert bør velge 1 i 5 av 6 tilfeller, mens vi bør velge 1 i 1 av 2 tilfeller. Men det skurrer jo litt i forhold til det som er intuitivt, siden man skulle tro at vi helst vil velge 1 oftere selv.
KjetilEn
Dirichlet
Dirichlet
Innlegg: 191
Registrert: 28/02-2007 17:30
Sted: Oslo

Virker fornuftig. Så hvis Albert bruker "best-play" vil han mest sannsynelig tjene penger hvis du ikke har funnet "best-play", og hvis begge bruker "best-play" går det i null?

Så det blir da likegyldig om man spiller med Albert's regler eller ikke.
Those who know a lot, don't know more about how much they know than those who know less.
sEirik
Guru
Guru
Innlegg: 1551
Registrert: 12/06-2006 21:30
Sted: Oslo

Jupp, så jeg vil påstå at
Dere spiller veldig mange ganger. Hvordan ville du spilt for å tjene mest mulig?
Du bør spille 1 kr i 50 % av tilfellene og 5 kr i resten av tilfellene.
Hvordan kommer Albert til å spille?
Albert vil spille 1 kr i 5 av 6 tilfeller og spille 5 kr i resten av tilfellene.
Hvis du får tilbud om å bytte rolle med Albert, altså endre reglene sånn at det er du som vinner ved like mynter, ville du gjort det da?
Helt likegyldig.
Hvor mye kan du regne med å tjene/tape per spill i lengden?
Det går i null.
mrcreosote
Guru
Guru
Innlegg: 1995
Registrert: 10/10-2006 20:58

Solid arbeid på kort tid, Eirik. Jeg er imponert.

Kjetil: Så lenge Albert spiller som beskrevet vil det gå i null i lengden uavhengig av hva du velger. Hvis smarte Albert derimot registrerer at du avviker fra best-play, vil han endre sin strategi til det som heter en rein strategi, altså å konsekvent spille på det ene utfallet. Det blir greit matematisk forklart av Eirik.

Denne oppgava hører til den greina av matematikken heter spillteori og er ikke eldre enn fra forrige århundre. Det har store anvendelser i økonomi, biologi+++. Å sette seg inn i grunnbegrepene er ikke spesielt vanskelig, og du trenger ikke kunne stort mer enn simpel kalkulus (derivere og sette lik 0 for eksempel), litt matriseregning og kanskje litt sannsynlighetsregning. Ikke noe problem å lese litt for videregående elever.

Boka/filmen A Beautiful Mind handler om John Nash som i 1994 fikk Nobelprisen i økonomi og han har gjort en del arbeider innen faget. Det som blei funnet tidligere var det som heter en Nash-likevekt; det er en mengde strategier, en for hver hver spiller som er sånn at om alle spillerne (det kan være flere enn 2 i et generelt spill) holder seg til sin likevektsstrategi, vil det ikke lønne seg for en enkelt å avvike fra denne. Nash viste at ethvert spill har minst en slik Nash-likevekt.
sEirik
Guru
Guru
Innlegg: 1551
Registrert: 12/06-2006 21:30
Sted: Oslo

Artig oppgave :)

Jeg har et bedre forslag til spillestrategi.
Installer et skjult kamera på veggen bak Albert slik at du kan se hvilken mynt han velger, og slik at han ikke ser kameraet. Du vil da naturligvis vinne i 100 % av tilfellene, hehe.

Liten oppfølgeroppgave: Sett at Albert ikke oppdager kameraet, men irriterer seg mer og mer siden du hele tiden vinner.
Hvor mye kan du da forvente å tjene i lengden pr. spill?
sEirik
Guru
Guru
Innlegg: 1551
Registrert: 12/06-2006 21:30
Sted: Oslo

Hmm, ved nærmere ettertanke ser jeg at man kanskje ikke kan si noe om hvor mye en kan forvente å tjene i lengden pr. spill.
Albert vil sette p = 5/6, og når vi følger ham, og dermed setter q = 1/6, vil Albert prøve å forandre strategi, til p = 0. Da vil vi i praksis forandre strategi til q = 1, og da vil Albert forandre strategi til p = 1 osv osv.
Svar