Thanks!
Lær dere statistikk
Moderators: Vektormannen, espen180, Aleks855, Solar Plexsus, Gustav, Nebuchadnezzar, Janhaa
Heh, jeg håper å forstå faget tvers gjennom. Jeg har funnet at fag jeg ikke liker, er generelt fag jeg ikke forstår og ender opp med å henge etter i. Det har jo litt med at jeg kanskje burde brukt mer tid på det, men jeg foretrekker å skylde på andre ting enn egne svakheter.
Jeg går dataingeniør (2. klasse) ved HiST. Har bacheloren klar i 2014 om jeg ikke fucker opp i nevneverdig grad.
Jeg går dataingeniør (2. klasse) ved HiST. Har bacheloren klar i 2014 om jeg ikke fucker opp i nevneverdig grad.
-
mstud
- Grothendieck

- Posts: 825
- Joined: 14/02-2011 15:08
- Location: Matteboken (adresse kun gyldig i semesteret) :)
Har hatt statistikk nå i høst... Ikke såå illeAleks855 wrote:Det gjelder dere alle. Jeg skal ha statistikk til våren, og hvis dere ikke svarer på alle mine spørsmål innen 5 minutter (selv de jeg stiller rundt 04:27), så kommer jeg til å ha en dårlig vår.
Thanks!
Forelesningene våre (litt rota sammen med noe juss) ligger på video (fag STAT110): (Faktisk ganske bra forelsninger
Det er bedre å stille et spørsmål og ikke få et svar, enn å ikke stille et spørsmål og ikke få et svar.
Det aller beste er enten:
å stille et spørsmål og få et svar
eller
å ikke stille et spørsmål og få et svar.
Det aller beste er enten:
å stille et spørsmål og få et svar
eller
å ikke stille et spørsmål og få et svar.
-
mstud
- Grothendieck

- Posts: 825
- Joined: 14/02-2011 15:08
- Location: Matteboken (adresse kun gyldig i semesteret) :)
Aleks855 wrote:Nice, liker videoer
Akkurat nå sitter jeg og leser om Bessels korreksjon, men jeg får ikke helt forståelsen for den. Du vet ikke om det fins en fin forklaring på den blant videoene vel?
Kan ikke huske at det er det...
Det er bedre å stille et spørsmål og ikke få et svar, enn å ikke stille et spørsmål og ikke få et svar.
Det aller beste er enten:
å stille et spørsmål og få et svar
eller
å ikke stille et spørsmål og få et svar.
Det aller beste er enten:
å stille et spørsmål og få et svar
eller
å ikke stille et spørsmål og få et svar.
Si at vi skal finne variansen til høyden av 18 år gamle norske menn.
Vi velger ut 1000 18-årige norske menn og måler høydene.
Vi beregner gjennomsnittet [tex]\mu_s=\frac{1}{1000}\sum_{i=1}^{1000}h_i[/tex] av disse 1000, der [tex]h_i[/tex] er høyden til person i. Er dette gjennomsnittet den egentlige forventningsverdien til høyden av alle norske 18-årige menn? Sannsynligvis ikke.
Når vi nå ønsker å estimere variansen kan vi naivt bruke den kjente formelen
[tex]s^2 = \frac{1}{1000} \sum_{i=1}^{1000}(h_i-\mu_s)^2[/tex].
Her bruker vi altså snittet [tex]\mu_s[/tex] til de utvalgte 1000 mennene, ikke den egentlige forventningverdien.
Det riktige vil egentlig være å bruke formelen
[tex]s^2 = \frac{1}{1000} \sum_{i=1}^{1000}(h_i-\mu)^2[/tex],
der [tex]\mu[/tex] er den egentlige forventningsverdien, som vi ikke kjenner.
Det vil nå alltid være slik at den siste formelen er større eller lik den første.
Her kommer Bessels korreksjon inn, som sier at vi heller bør bruke formelen
[tex]s^2 = \frac{1}{1000-1} \sum_{i=1}^{1000}(h_i-\mu_s)^2[/tex].
Dette er selvsagt ikke noe bevis, men en illustrasjon av prinsippet bak korreksjonen.
Vi velger ut 1000 18-årige norske menn og måler høydene.
Vi beregner gjennomsnittet [tex]\mu_s=\frac{1}{1000}\sum_{i=1}^{1000}h_i[/tex] av disse 1000, der [tex]h_i[/tex] er høyden til person i. Er dette gjennomsnittet den egentlige forventningsverdien til høyden av alle norske 18-årige menn? Sannsynligvis ikke.
Når vi nå ønsker å estimere variansen kan vi naivt bruke den kjente formelen
[tex]s^2 = \frac{1}{1000} \sum_{i=1}^{1000}(h_i-\mu_s)^2[/tex].
Her bruker vi altså snittet [tex]\mu_s[/tex] til de utvalgte 1000 mennene, ikke den egentlige forventningverdien.
Det riktige vil egentlig være å bruke formelen
[tex]s^2 = \frac{1}{1000} \sum_{i=1}^{1000}(h_i-\mu)^2[/tex],
der [tex]\mu[/tex] er den egentlige forventningsverdien, som vi ikke kjenner.
Det vil nå alltid være slik at den siste formelen er større eller lik den første.
Her kommer Bessels korreksjon inn, som sier at vi heller bør bruke formelen
[tex]s^2 = \frac{1}{1000-1} \sum_{i=1}^{1000}(h_i-\mu_s)^2[/tex].
Dette er selvsagt ikke noe bevis, men en illustrasjon av prinsippet bak korreksjonen.
Ja, det var en fin illustrasjon, bedre enn de jeg finner andre steder. Og det er sånn ca. dit jeg kommer.
Alle ser ut til å mene at vi deler på (n-1) for å gjøre opp for underestimeringa, og det er jo greit i og for seg.
Men noen prøver å forklare videre med at den siste observasjonen i utvalget kan regnes ut siden vi vet snittet, og vi vet de 999 andre verdiene. Altså har ikke den siste verdien noen frihetsgrad, siden den kan løses med en enkel likning.
Det er jo også vel og greit, men jeg ser ikke hvorfor "sistemann" trekkes fra i divisjonen. Vi bruker jo fremdeles sistemanns avvik (eller kvadratet av det) i summen, så vi har ikke valgt å ignorere den verdien helt.
Det eneste jeg får ut av det, er at det kompenserer noe for underestimeringa. Ikke nøyaktig heller, bare MER nøyaktig.
Alle ser ut til å mene at vi deler på (n-1) for å gjøre opp for underestimeringa, og det er jo greit i og for seg.
Men noen prøver å forklare videre med at den siste observasjonen i utvalget kan regnes ut siden vi vet snittet, og vi vet de 999 andre verdiene. Altså har ikke den siste verdien noen frihetsgrad, siden den kan løses med en enkel likning.
Det er jo også vel og greit, men jeg ser ikke hvorfor "sistemann" trekkes fra i divisjonen. Vi bruker jo fremdeles sistemanns avvik (eller kvadratet av det) i summen, så vi har ikke valgt å ignorere den verdien helt.
Det eneste jeg får ut av det, er at det kompenserer noe for underestimeringa. Ikke nøyaktig heller, bare MER nøyaktig.



