Innhold

Innledning

Her behandles binomisk fordeling og hypergeometrisk fordeling. Det finnes mange flere.

Binomisk fordeling

En binomisk sannsynlighetsmodell kan brukes dersom følgende tre kriterier er oppfylt:

  • Et forsøk består i om en hendelse inntreffer eller ikke, altså kun to mulige utfall.
  • Sannsynligheten p for at hendelsen skal inntreffe er den samme i alle forsøk
  • Forsøkene er uavhengige av hverandre slik at resultatet fra et forsøk ikke virker inn på det neste.

Vi kaller dette en binomisk forsøksrekke. Dersom X er antall utfall i en binomisk forsøksrekke der hendelsen inntreffer er X en diskret stokastisk variabel med følgende sannsynlighetsfordeling:

$P(X=x)= \binom{n}{x} p^x \cdot (1-p)^{n-x}$


n er antall forsøk.

Forventningsverdien til X er:

E(X) = np

Variansen til X er:

Var (X) = np(1-p)


Eksempel 1:
Spireevnen til en type frø er 85%. Ti frø blir plantet. Hva er sannsynligheten for at 8 frø spirer?
$P(X=8)= \binom{10}{8} 0,85^8 \cdot 0,15^2 = 0,28$

Test deg selv

Hypergeometrisk fordeling

Hypergeometrisk fordeling ligner på binomisk fordeling, men har følgende karakteristiske trekk:

  • En populasjon med N elementer inneholder a elementer med en spesiell egenskap.
  • Man foretar n trekninger UTEN tilbakelegging (sannsynligheten endrer seg).
  • x er antall enheter med den bestemte egenskapen.

Sannsynligheten for at x av elementene som trekkes har egenskapen a er:


$P(X=x)=\frac{\binom{a}{x} \cdot \binom{N-a}{n-x} }{\binom{N}{n} }$
Eksempel 2:
En skuff består av 10 kniver med sort skaft og 5 kniver med rødt skaft. Man trekker 4 kniver uten tilbakelegging. Hva er sannsynligheten for at 3 av knivene som trekkes tilfeldig har rødt skaft?
$P(X=3)=\frac{\binom{5}{3} \cdot \binom{10}{1} }{\binom{15}{4} }= 0,073$

Test deg selv

binomisk vs. hypergeometrisk fordeling

Den hypergeometriske fordelingen ligner på den binomiske, med den forskjell at sannsynligheten i delforsøkene IKKE er den samme.

Den hypergeometriske modellen brukes når populasjonen er liten og man trekker ut en betydelig del av den.

Dersom populasjonen er stor vil den hypergeometriske modellen nærme seg den binomiske og man bruker da den binomiske fordi den er lettest å arbeide med da den har færre parametere.

Dersom populasjonen er stor i forhold til utvalget (N > 10n) gjelder:

Hypergeometrisk fordeling (N,a,n) ≈ Binomisk fordeling (n,p)

$p = \frac aN$

Hvorfor er det slik?

Tenk deg en urne med et 50 kuler av to typer. Dersom du trekker ut 20 kuler uten tilbakelegging, altså en stor andel av det totale antall kuler i urnen, vil sannsynligheten endre seg betydelig for hvert trekk. Dette er en hypergeometrisk situasjon.

Eksempel 3:
I en urne finnes 40 kuler av type A og 10 kuler av type B. Man trekker ut 20 kuler uten tilbakelegging. Hva er sannsynligheten for å trekke 5 kuler av type B? Ved å regne hypergeometrisk får man

$P(X=5)=\frac{\binom{10}{5} \cdot \binom{40}{15} }{\binom{50}{20} }= 0,22$

Dersom man regner binomisk får man

$P(X=5)= \binom{20}{5} 0,2^5 \cdot 0,8^{15} = 0,17$
Man observerer at det er stor forskjell på de to svarene, det første er riktig.


Dersom man har en urne med 1000 kuler og trekker ut 20 kuler uten tilbakelegging vil endringen i sannsynlighet være neglisjerbar. Dette er også en hypergeometrisk situasjon, men siden endringen i sannsynlighet er neglisjerbar kan man regne binomisk da det gir enklere regning.

Eksempel 4:
I en urne finnes 800 kuler av type A og 200 kuler av type B. Man trekker ut 20 kuler uten tilbakelegging. Hva er sannsynligheten for å trekke 5 kuler av type B? Ved å regne hypergeometrisk får man

$P(X=5)=\frac{\binom{200}{5} \cdot \binom{800}{15} }{\binom{1000}{20} }= 0,176$

Dersom man regner binomisk får man

$P(X=5)= \binom{20}{5} 0,2^5 \cdot 0,8^{15} = 0,17$
Man observerer at fordelingene nærmer seg hverandre når populasjonen er stor i forhold til det antall man trekker ut.

Test deg selv