Sannsynlighet

Innledning

Sannsynlighet er et ”nytt” fagområder i matematikk. Grunnlaget ble lagt av Fermat og Pascal i 1654 og utviklingen har fortsatt til langt ut på 1900 tallet. Sannsynlighet brukes i dag blant annet innen spillteori, forsikring og økonomi, medisin, moderne fysikk, for å nevne noen områder. Hendelser som kan forutsies kalles deterministiske. Hendelser vi ikke kan forutsi, som for eksempel utfallet av et terningkast, kalles tilfeldige forsøk.

Vi skal her befatte oss med hendelser vi ikke kan forutsi, men som vi allikevel prøver å si noe om. På engelsk heter sannsynlighet probability. Derfor bruker man bokstaven P som symbolet for sannsynlighet.

”Sannsynligheten for regn i morgen” skrives P(regn i morgen).

”Sannsynligheten for å få terningkast seks” skrives P(6).

Utfallsrom

Hvor mange utfall kan et terningkast ha? En terning har seks flater med øyner fra en til seks, det betyr at utfallet vil være blant disse. Vi kaller alle mulige utfall for utfallsrommet. Et enkelt utfall vil være et element i utfallsrommet:

U = { 1, 2, 3, 4, 5, 6 }

Ufallsrommet ved et myntkast vil være: U = {kron, mynt}

Eksperimentell sannsynlighet - relativ frekvens - hyppighet

Hva er sjansen for å få fire øyner? Vi kan finne det ut på to måter, ved å gjennomføre mange terningkast, eller ved regning.

Vi lar datamaskinen kaste terning for oss, det kalles å simulere terningkast. På 20 kast får maskinen 6 firere. Den relative frekvensen for firere etter 20 kast er 6/20 = 0,3 eller 30%. Figur 1. viser fordelingen av øyner.

Figur 1.: Figuren viser fordelingen av øyner etter 20 terningkast.

Ut fra erfaring vil man kanskje forvente at sannsynligheten for å få firere skulle være den samme som å få treere eller femmere eller noe annet i utfallsrommet. Etter 20 terningkast kan man ikke trekke en slik konklusjon.

Vi setter maskinen til å kaste en terning 10.000 ganger. Det gir følgende resultat:

Figur 2.: Figuren viser fordelingen av øyner etter 10000 terningkast.

Nå ser det ut til at sannsynligheten for fire øyner går mot et tall som ligger rundt 0,16 – 0,17, dvs. 16 – 17%. Man ser at sannsynligheten for å få et annet antall øyner er nesten den samme.

Sannsynligheten er lik den relative frekvens i det lange løp.

Nå er ikke 10.000 det samme som "det lange løp", men tilstrekkelig til å se en tendens som bekreftes når vi behandler problemet teoretisk.

Test deg selv

Teoretisk sannsynlighet

Utfallsrommet viser oss at det er seks mulige utfall når vi kaster en terning. Vi er bare interessert i å få en firer. Bare en av seks muligheter gir en firer. Det betyr at sannsynligheten for å få en firer i et kast er 1/6 eller 0,167 eller 16,7%. Vi kan skrive det slik:

P (4) = 1/6 = 0,167 = 16,7%

Sannsynligheten kan altså presenteres som

Brøk
Desimalbrøk
Prosent
Presentasjonsformene er likeverdige men det er en god vane å holde seg til den formen som er gitt i oppgaven, dersom noe annet ikke er spesifisert.

Man forutsetter at sannsynligheten for å få et av de seks utfallene er den samme for alle utfall. Når det er slik sier vi at vi har en uniform sannsynlighet.

En sannsynlighetsmodell for et tilfeldig forsøk gir sannsynligheten for hvert enkelt utfall i utfallsrommet. Sannsynligheten for alle utfall i utfallsrommet er til sammen 1. Sannsynligheten for hvert enkelt utfall er mellom 0 og 1. Om våre teoretiske sannsynlighetsmodeller er gode, er det kun utprøving som kan fortelle oss.

Uniform sannsynlighet

Når sannsynligheten er den samme for alle elementer i utfallsrommet sier man at sannsynligheten er uniform – uniform sannsynlighet.

Når vi har en uniform sannsynlighetsmodell er sannsynligheten for en hendelse A gitt ved:

<math> P(A) = \frac{ \text{Antall gunstigen hendelser}}{\text{Antall mulige hendelser}} </math>

Hva er sannsynligheten for å få en femmer eller en sekser i et terningkast? Sannsynligheten for å få en femmer er 1/6 og sannsynligheten for å få en sekser er 1/6. Sannsynligheten for femmer eller sekser blir da:

P(5 eller 6) = P(5) + P(6) = 1/6 + 1/6 = 1/3

Test deg selv

Venndiagram

Et venndiagram er en grafisk fremstilling av en eller flere mengder, og eventuelle delmengder. Størrelsen av arealet i diagrammet har ingen matematisk betydning.

Eksempel:

I en klasse på 20 elever har 4 elever spansk og 12 elever fysikk. 2 elever har begge deler. Denne situasjonen kan fremstilles i et Venndiagram:

Et venndiagram kan skape klarhet i situasjonen: 6 elever (blå) har ikke spansk eller fysikk. 2 elever har både fysikk og spansk. 4 (2+2) elever har spansk og 12 elever har fysikk. 10 av disse har ikke spansk. Det totale antall elever er 20. En feil som ofte gjøres er at de elementer som er med i flere mengder (spansk og fysikk) telles to (eller flere) ganger.

Test deg selv

Krysstabell

Situasjonen med elever i spansk og fysikk kan også presenteres i form av en krysstabell. Da ser det slik ut:

Poenget med begge presentasjonsformer (og med valgtre som kommer lenger nede på siden) er å systematisere ved utvelgelse, slik at det blir lettere å se hva som er gunstig av antall mulige.

Test deg selv

Komplementære hendelser

I en klasse har noen elever spansk valgfag. Man skal velge ut en elev fra klassen, og definere hendelse A = ”elev har spansk valgfag”. Alle elever som ikke har spansk valgfag vil inngå i mengden som er komplementær til A.

Situasjonen kan se slik ut presentert i et Venndiagram:

Vi har at

<math>P(A)+P(\bar{A})=1</math>

Union og snitt

Union og snitt er begreper som kommer fra mengdelæren. Eksempelvis er A alle som liker matematikk og B er de som liker softis.

Union mellom A og B er da som liker is ELLER de som liker matematikk ELLER de som liker begge deler. Union symboliseres med U.

De som liker matematikk eller softis eller begge deler befinner seg i venndiagrammets hvite del, <math>A\cup B </math>.
Sannsynligheten for å trekke en person som liker softis eller matematikk, eller begge deler blir
<math>P(A\cup B) </math>

A snitt B er de som liker matematikk OG softis. Symbolet er ∩ og det kan se slik ut i et Venndiagram:

De som liker både matematikk og softis befinner seg i venndiagrammets gule del, <math>A\cap B </math>.
Sannsynligheten for å trekke en person som liker softis og matematikk blir <math>P(A\cap B) </math>

Disjunkte hendelser

A og B er disjunkte mengder fordi ingen elementer er felles. Dersom A er personer som liker is og B er personer som liker brus er det i denne mengden ingen personer som liker både brus og is. Det er imidlertid en gruppe (blått) som liker verken is eller brus.

Siden A og B ikke har noen felles elementer skriver vi A ∩ B = Ø. Tegnet Ø betyr den tomme mengde.

Addisjonssetningen

Den generelle addisjonssetningen er gitt som:

<math>P(A\cup B) = P(A) + P(B) - P(A\cap B) </math>

Eksempel

Vi kaster en terning en gang. Hendelsen øyner mindre eller lik to kaller vi A, A={1,2}. Hendelsen partall kaller vi B, B = {2,4,6}

I et venndiagram ser det slik ut:

Sannsynligheten for A blir P(A) = 2/6 = 1/3

Sannsynligheten for B blir P (B) = 3/6 = ½

Sannsynligheten for A ∩ B blir P(A ∩ B) = 1/6, fordi mengden inneholder ett av utfallsrommets seks elementer.

Hva er sannsynligheten for A U B?

Vi bruker addisjonssetningen og får: P(AUB) = P(A) + P(B) - P(A ∩ B) = 1/3 + ½ - 1/6 =4/6 = 2/3

Man ser, både av venndiagrammet og av addisjonssetningen hvorfor man må trekke fra

P(A ∩ B). Dersom vi ikke hadde gjort det hadde vi regnet med elementet 2 en gang for mye.

Addisjonssetningen for disjunkte hendelser

Disjunkte hendelser mangler noen felles elementer. Derfor blir addisjonssetningen for disjunkte hendelser:

<math>P(A\cup B) = P(A) + P(B) </math>

Betinget sannsynlighet

Med betinget sannsynlighet menes sannsynligheten for en hendelse når man har opplysninger om at en annen hendelse allerede har inntruffet.

Sannsynligheten for hendelse A gitt at hendelse B har inntruffet skrives:

P(A|B)

Man leser: "sannsynlighet for a gitt b". Vi har P(A∩B) = P(B) ∙ P(A|B)

Produktsetningen

Dersom hendelsene A og B skal inntreffe må først A inntreffe så må B inntreffe. Dersom sannsynligligheten for B er avhengig av om A inntreffer eller ikke, blir sannsynligheten for at A og B inntreffer:

<math>P(A \cap B) = P(A)\cdot P(B|A) </math>

Uavhengige hendelser

To hendelser A og B er uavhengige dersom

P(A) = P(A|B), som fører til uavhengighetskriteriet:

P(A∩B) = P(A) ∙ P(B)

Uavhengige hendelser forveksles av og til med disjunkte hendelser. For disjunkte hendelser gjelder

P(A∩B) = 0

Produktsetningen for uavhengige hendelser

Dersom man kaster en terning to ganger vil ikke resultatet fra første kast påvirke resultatet i andre kast. Hendelsene er uavhengige. Produktsetningen for uavhengige hendelser er:

<math>P(A \cap B) = P(A)\cdot P(B) </math>

Eksempel:

Hva er sannsynligheten for å få tre øyner i første kast og seks øyner i andre kast, når en terning kastes to ganger?

Sannsynligheten blir P( 3 ∩ 6) = (1/6) ∙ (1/6) = 1/36

Valgtre

Valgtre er i tilegg til venndiagram og kysstabell en grafisk måte å fremstille en situasjon på for å få oversikt over valgmuligheter og telling.

Eks:

I en gruppe på 30 spiller 10 personer fotball (A). I den samme gruppen driver 5 personer friidrett (B). To personer bedriver begge deler. Det leder til følgende valgtre:

Vi finner følgende sannsynligheter:

Sannsynligheten for at en tilfeldig elev ikke spiller fotball:

Sannsynligheten for at en tilfeldig elev spiller fotball:

eller slik:

Sannsynligheten for at en tilfeldig elev spiller fotball og driver friidrett:

Sannsynligheten for at en tilfeldig elev spiller fotball, men ikke driver friidrett:

Sannsynligheten for at en tilfeldig elev ikke spiller fotball, men driver friidrett:

Sannsynligheten for at en tilfeldig elev ikke driver med fotball eller friidrett:

Man observer at summen av sannsynlighetene på hver enkelt gren av treet blir lik 1.

Tilnærmingen skyldes avrundingen i mellomregningen

Total sannsynlighet

Treet over gir oss sannsynligheten for å velge ut en fotballspiller direkte. Dersom man ønsker å finne sannsynligheten for å trekke ut en friidrettsutøver, uavhengig av fotball, er ikke det fullt så åpenbart.

Sannsynligheten for å velge en person som driver friidrett er på grenene "fotball og friidrett" og "ikke fotball og friidrett". Litt mer matematisk blir sannsynligheten slik:

Dette kalles gjerne den totale sannsynlighet (for B).

BAYES FORMEL (nedenfor) ER IKKE 1T PENSUM, DEN ER PENSUM I R1----

Bayes formel

Friidrett = B og fotball = A En elev driver friidrett. Hva er sannsynligheten for at eleven også spiller fotball? Vi ønsker å finne P(A | B). Vi har:

P( fotball og friidrett ) = P (friidrett) · P ( fotball gitt friidrett )

Litt mer matematisk:

er også det samme som
<math>P(B \cap A) = P(A) \cdot P(B|A) </math>

Setter man de to uttrykkene lik hverandre får man
<math>P(A) \cdot P(B|A) = P(B) \cdot P(A|B) </math>
som gir:

<math> P(B|A) = \frac{P(B) \cdot P(A|B)}{P(A)} </math>

Man har nå en sammenheng mellom en betinget sannsynlighet og den motsatte betingede sannsynligheten. Relasjonen eller formelen kalles for Bayes setning.

Eks:
tidligere 2MX eksamensoppgave
Livmorkreft er en kreftform som kan ramme voksne kvinner i alle aldere. Celleforandringer i livmorhalsen kan være forstadier til kreft. De kan påvises ved celleprøver. Kreftregisteret anbefaler alle kvinner mellom 25 og 69 år å ta en slik celleprøve hvert tredje år. Resultatene av slike celleprøver er likevel ikke helt sikre. Fra medisinske undersøkelser har en erfart at
-For en kvinne som har celleforandringer i livmorhalsen, vil en celleprøve avsløre det i 75% av tilfellene.
-For kvinner som ikke har celleforandringer i livmorhalsen, vil en celleprøve likevel tyde på celleforandringer i 5% av tilfellene.
Vi går ut fra at 3% av de kvinner som tar celleprøver, faktisk har celleforandringer i livmorhalsen. Vi tar for oss en kvinne som tar celleprøven og innfører hendingene:
C: " Kvinnen har celleforandringer i livmorhalsen."
T: "Celleprøven tyder på at kvinnen har celleforandringer i livmorhalsen."
Opplysningene over gir disse sannsynlighetene
P(C) = 0,03
P(T|C) = 0,75

<math>P(T \cap \bar C) = 0,05 </math>

a) Finn <math>P(C \cap T) </math> og <math>P(\bar C \cap T) </math>

<math>P(C \cap T) </math>er sannsynligheten for "celleforandring" OG "prøven tyder på celleforandring". Vi får

<math>P(C \cap T)= P(C) \cdot P(T|C)= 0,03 \cdot 0,75 = 0,0225</math>

eller 2,25%

<math>P(\bar C \cap T) </math> er sannsynligheten for "ikke celleforandring " OG "prøven tyder på celleforandring". Vi
får :

<math>P(\bar C \cap T) = P( \bar C ) \cdot P(T| \bar C) = 0,97 \cdot 0,05 = 0,0485</math>

eller 4,85%

b) Vis at P(T) = 0,071

T er hendelsen at prøven tyder på celleforandring. Man må huske på at hendelsen kan inntreffe både ved "celleforandring" og "ikke celleforandring". Man finner den totale sannsynlighet for T slik:

<math>P(T)= P( \bar C \cap T) + P(C \cap T) = P( \bar C) \cdot P(T| \bar C) + P(C) \cdot P(C|T) = 0,0225 + 0,0485 = 0,071 </math>

c) Gå ut fra at en celleprøve tyder på at en kvinne har celleforandringer i livmorhalsen. Hva er da sannsynligheten for at det virkelig er tilfelle?
Her spørres det om sannsynligheten for celleendringer når testen indikerer dette, Altså P(C|T). Man observerer at dette er den omvendte betingede sannsynligheten, i forhold til P(T|C) som allerede er kjent. Siden både P(C) og P(T) er kjent kan man anvende Bayes setning og får:

<math>P(C|T) = \frac{P(C) \cdot P(T|C)}{P(T)} = \frac{0,03 \cdot 0,75 }{0,071} = 0,32</math>

eller 32%

Man observerer at selv om testen er positiv er det 32% sjanse for at kvinnen er frisk.

Dersom en celleprøve tyder på at en kvinne har celleforandringer i livmorhalsen, vil legen hennes følge opp med flere undersøkelser for å avgjøre om det virkelig er tilfellet. Selv om det viser seg at hun faktisk har celleforandringer, trenger det ikke være så alvorlig.
60% av slike celleforandringer går over av seg selv, mens resten kan behandles med et relativt enkelt inngrep.
Tenk deg at ti kvinner etter grundige undersøkelser har fått bekreftet at de har celleforandringer i livmorhalsen.

d) Hva er sannsynligheten for at celleforandringene går over av seg selv for minst åtte av kvinnene?
<math> P(X=8)+ P(X=9) + P(X=10) = \left ({10}\\{8} \right) 0,6^8 \cdot 0,4^2 + \left ({10}\\{9} \right) 0,6^9 \cdot 0,4^1 + = \left ({10}\\{10} \right)0,6^{10} \cdot 0,4^0 =
0,12 + 0,04 + 0,01 = 0,17</math>