Sannsynlighet - 3MX!

Her kan du stille spørsmål vedrørende problemer og oppgaver i matematikk for videregående skole og oppover på høyskolenivå. Alle som føler trangen er velkommen til å svare.

Moderatorer: Aleks855, Gustav, Nebuchadnezzar, Janhaa, DennisChristensen, Emilga

Svar
jchrjc
Cayley
Cayley
Innlegg: 66
Registrert: 27/05-2007 23:41

Kom opp i 3MX eksamen nå til torsdag og syns statistikk kapitellet (kap.8) er litt vanskelig og dårlig forklart i læreboka..
(Ser ut til at det aldri har blitt gitt en eksamen uten en oppgave herfra)

Noen som vet om en bra internett-side der det står litt informasjon rundt dette temaet?
Skjønner ikke helt når jeg skal bruke de forskjellige fremgangsmåtene og sånnt..

Håper noen vet om noe :D :D
UiO
jchrjc
Cayley
Cayley
Innlegg: 66
Registrert: 27/05-2007 23:41

Har litt tungt for å forstå et par ting..

- Hva vil det si at et intervall har konfidensnivå 0,95?

- Hva er forskjellen på et konfidensintervall for phi (forventingsverdien) og for p?
(Er p en estimator eller det samme som p^ (hatt)?..Hva er isåfall forskjellen?)

Håper noen kan hjelpe :)

3MX-eksamen i morra! =)
UiO
Dinithion
Hilbert
Hilbert
Innlegg: 1025
Registrert: 17/01-2008 13:46

At ett intervall har konfidensnivå på 0.95 vil si at det er 95% for at den reelle sannsynligheten ligger innenfor intervallet. Jeg skal gi ett eksempel.

Man tar en stikkprøve av en stor populasjon, og forsøket er på 500 personer. 50% svarer ja på ett spørsmål og 50% svarer nei. Siden dette bare er en stikkprøve, så kan vi ikke vite om 0.5 er den reelle sannsynligheten for "ja". For å få ett nøyaktig svar må vi spørre hele populasjonen. Det gjør vi jo selvfølgelig ikke. Derfor finner vi ett konfidensintervall.

(Vi kan si at 250 sa ja. Da får vi [tex]\hat p = \frac{250}{500} = 0.5[/tex]

For å finne konfidensintervallet regner vi først ut standardfeilen. Den er gitt ved

[tex]S_{\hat p} = \sqrt{\frac{\hat p (1 - \hat p)}{n}[/tex]

I vårt eksempel gir det oss en Standardfeil på 0.022. Z-verdien for et konfidensintervall på 0.95 = 1.96. Dette gir

[tex]zS_{\hat p} = 0.022 \cdot 1.96 = 0.438[/tex]

[tex]<N , OE> = <\hat p - zS_{\hat p}\, ,\, \hat p + zS_{\hat p}> = <0.456\,,\,0.544>[/tex]

(Latex likte ikke Ø)

Hvis vi nå sier at dette intervallet er sannsynligheten for ja. Da ser vi ut fra dette intervallet at det er 95% sannsynlighet at andelen for "ja" blant hele populasjonen ligger mellom 45.6% og 54.4%. Det betyr ikke at den gjør det. Vi kan ha vært uheldig i utvelgelsen og at de vi valgte ut ikke er reprasentativ for hele populasjonen. Det er 5% sjans for at den reelle sannsynligheten ligger utenfor intervallet. Dette forutsetter forresten at det er binomisk sannsynlighet. Dvs lik sannsynlighet hele veien, uavhengige hendelser og bare to utfall.

Dette intervallet er jo ganske bredt. Det er på 8.8%, noe som er forholdsvis stort. Får å få det enda mindre må vi ta en større stikkprøve.

Forventningsverdien så tenker du sikkert på my? Det blir jo samme greiene, men da bruker du andre formler. Det bruker når det ikke er binomisk. F.eks så ble det vel gitt på en eksamen engang en rekke med jordbærkurver. Da skulle man finne gjennomsnittsvekt og finne ett konfidensintervall for vekten av kurvene.
Fry: Hey, professor. Which course do you teach?
Professor Hubert Farnsworth: Mathematics in quantum neutrino fields. I chose the name myself to scare away any students.
jchrjc
Cayley
Cayley
Innlegg: 66
Registrert: 27/05-2007 23:41

Dinithion skrev:At ett intervall har konfidensnivå på 0.95 vil si at det er 95% for at den reelle sannsynligheten ligger innenfor intervallet. Jeg skal gi ett eksempel.

Man tar en stikkprøve av en stor populasjon, og forsøket er på 500 personer. 50% svarer ja på ett spørsmål og 50% svarer nei. Siden dette bare er en stikkprøve, så kan vi ikke vite om 0.5 er den reelle sannsynligheten for "ja". For å få ett nøyaktig svar må vi spørre hele populasjonen. Det gjør vi jo selvfølgelig ikke. Derfor finner vi ett konfidensintervall.

(Vi kan si at 250 sa ja. Da får vi [tex]\hat p = \frac{250}{500} = 0.5[/tex]

For å finne konfidensintervallet regner vi først ut standardfeilen. Den er gitt ved

[tex]S_{\hat p} = \sqrt{\frac{\hat p (1 - \hat p)}{n}[/tex]

I vårt eksempel gir det oss en Standardfeil på 0.022. Z-verdien for et konfidensintervall på 0.95 = 1.96. Dette gir

[tex]zS_{\hat p} = 0.022 \cdot 1.96 = 0.438[/tex]

[tex]<N , OE> = <\hat p - zS_{\hat p}\, ,\, \hat p + zS_{\hat p}> = <0.456\,,\,0.544>[/tex]

(Latex likte ikke Ø)

Hvis vi nå sier at dette intervallet er sannsynligheten for ja. Da ser vi ut fra dette intervallet at det er 95% sannsynlighet at andelen for "ja" blant hele populasjonen ligger mellom 45.6% og 54.4%. Det betyr ikke at den gjør det. Vi kan ha vært uheldig i utvelgelsen og at de vi valgte ut ikke er reprasentativ for hele populasjonen. Det er 5% sjans for at den reelle sannsynligheten ligger utenfor intervallet. Dette forutsetter forresten at det er binomisk sannsynlighet. Dvs lik sannsynlighet hele veien, uavhengige hendelser og bare to utfall.

Dette intervallet er jo ganske bredt. Det er på 8.8%, noe som er forholdsvis stort. Får å få det enda mindre må vi ta en større stikkprøve.

Forventningsverdien så tenker du sikkert på my? Det blir jo samme greiene, men da bruker du andre formler. Det bruker når det ikke er binomisk. F.eks så ble det vel gitt på en eksamen engang en rekke med jordbærkurver. Da skulle man finne gjennomsnittsvekt og finne ett konfidensintervall for vekten av kurvene.
TUSEN TAKK, for at du tok deg tid til å skrive et så fyldig svar, forstod mer nå:))

Men et spm: Hvorfor brukte du den formelen for å finne standardfeilen?
Har litt problemer med å skjønne når jeg skal bruke de forskjellige..
Kan man ikke f.eks. bruke det empiriske standardavviket?
- Noen regler for når man skal bruke hva?

Takker for svar :D :D :D
UiO
Charlatan
Guru
Guru
Innlegg: 2499
Registrert: 25/02-2007 17:19

Den relle sannsynligheten har en bestemt verdi, og derfor kan det ikke være 95 % sannsynlighet for at den ligger innenfor et visst intervall.

Har man et konfidensintervall for p med konfidensnivå på 0.95, vil det si at hvis man tar en stikkprøve, er sannsynligheten for at p-hatt vil ligger innenfor konfidensintervallet 0.95.

Alternativt kan man si at hvis man har skal lage et konfidensintervall for p basert på en stikkprøve er det en sannsynlighet på 0.95 for at intervallet ligger over samme område på tallinja som den p.
Dinithion
Hilbert
Hilbert
Innlegg: 1025
Registrert: 17/01-2008 13:46

Jarle10, enten så missforstår jeg deg, eller så strider det mot hva jeg har lært. Jeg tviler dog ikke på at du har riktig :P

Hmm.. Da har jeg missforstått noe her. Jeg trodde at p-hatt var ett slags førsteutkast til p, basert på en stikk-prøve. Man vet ikke p, så man lager ett intervall det er sannsynlig at p ligger innenfor. Altså et konfidensintervall for p. Dette er altså feil?

p-hatt og p er med andre ord to helt forskjellige ting som ikke har noen sammenheng?
Fry: Hey, professor. Which course do you teach?
Professor Hubert Farnsworth: Mathematics in quantum neutrino fields. I chose the name myself to scare away any students.
jchrjc
Cayley
Cayley
Innlegg: 66
Registrert: 27/05-2007 23:41

Dinithion skrev:Jarle10, enten så missforstår jeg deg, eller så strider det mot hva jeg har lært. Jeg tviler dog ikke på at du har riktig :P

Hmm.. Da har jeg missforstått noe her. Jeg trodde at p-hatt var ett slags førsteutkast til p, basert på en stikk-prøve. Man vet ikke p, så man lager ett intervall det er sannsynlig at p ligger innenfor. Altså et konfidensintervall for p. Dette er altså feil?

p-hatt og p er med andre ord to helt forskjellige ting som ikke har noen sammenheng?
Stemmer med det jeg også har lært hvertfall..

p(hatt) er en forventningsrettet estimator for p..
UiO
Charlatan
Guru
Guru
Innlegg: 2499
Registrert: 25/02-2007 17:19

Det er en teoretisk nøyaktig verdi for p i alle binomiske forsøk. P-hatt brukes til å estimere denne verdien, men det forandrer ikke det faktum at p har en nøyaktig verdi.

Selvfølgelig har de en sammenheng, hvis ikke ville det vært nytteløst å estimere p med p-hatt. Den sentrale grensesetningen sier at så lenge stikkprøven er stor nok, kan vi få en estimator så nøyaktig vi vil til den reelle parameteren.
Svar