Bayes og spam!

Her kan du stille spørsmål vedrørende problemer og oppgaver i matematikk for videregående skole og oppover på høyskolenivå. Alle som føler trangen er velkommen til å svare.

Moderators: Aleks855, Gustav, Nebuchadnezzar, Janhaa, DennisChristensen, Emilga

Matte123

http://www.dagbladet.no/dinside/2003/04/25/367244.html, se på denne linken. Jeg har fått en oppgave på skolen, jeg skal tenke på hvordan det er mulig, under passende forutsetninger, å komme frem til den sannsynligheten som står her:
Graham nevner et eksempel. Dersom en epost inneholder ordet sex er det 97 prosent sannsynlig at det er en spam. Dersom den da ikke inneholder ord som sterkt indikerer at den er noe annet.


Kan noen hjelpe meg
mathvrak
Maskinmester
Maskinmester
Posts: 420
Joined: 18/04-2005 00:00

Denne mekanismen for å hindre spam er innebygget i f.eks Mozilla/Thunderbird mail programmet. I begynnelsen blir du først bedt om å markere spam som søppel, så blir thunderbird flinkere til å skille ut spam.

Thomas Bayes jobbet med statistikk problemer. Du kan finne ressurser om Thomas Bayes her:

http://en.wikipedia.org/wiki/Bayes

Noen artikler du kan lese om Bayesian spam filtre:

http://www.mozilla.org/mailnews/spam.html
http://www.paulgraham.com/spam.html
http://www.paulgraham.com/better.html
http://www.webopedia.com/TERM/B/Bayesian_filter.html
Last edited by mathvrak on 22/04-2005 00:07, edited 2 times in total.
Guest

Må bare fjerne kommaet etter linken, så fungerer den ypperlig.
Guest

Men hvis vi bare ser på den artikkelen, hvordan skal jeg forklare at han kom fram til det?? Skjønner ikke noe? Hjelp meg!
Matte123

Jeg skal forklare hvordan han kom fram til at det er 97% sannsynlighet for at det er spam, dersom en e-post inneholder ordet sex. Hvordan skal jeg sette opp dette? Hvordan i huleste skal jeg finne det ut?
Guest

Kan du ikke bruke Bayes setning! Men vet ikke helt hva jeg skal kalle A og B osv??
Auto-n00b
Noether
Noether
Posts: 43
Joined: 27/03-2005 16:22

Anonymous wrote:Kan du ikke bruke Bayes setning! Men vet ikke helt hva jeg skal kalle A og B osv??
Jo, man kan det.

Vi lar A være begivenheten at mailen er spam.
Vi lar B være begivenheten at mailen inneholder ordet "sex".

Vi skal da finne P(A|B), og vha. Bayes' setning får vi da:

P(A|B) = (P(B|A) * P(A))/P(B) = (0,650 * 0,500)/0,335 ~ 0,97 = 97 %.
Guest

Bare et spørsmål, hvor får du tallene fra??
Auto-n00b
Noether
Noether
Posts: 43
Joined: 27/03-2005 16:22

Anonymous wrote:Bare et spørsmål, hvor får du tallene fra??
Fra oppgaveteksten, som forøvrig minner latterlig mye om den Matte123 presenterte. Jeg antok derfor at det er snakk om den samme oppgaven som jeg har liggende her.
Beklager hvis tallene ikke stemmer.
TezzR

Auto-n00b: Orker du å legge ut den oppgaveteksten fra oppgaven du har liggende?
Guest

TezzR wrote:Auto-n00b: Orker du å legge ut den oppgaveteksten fra oppgaven du har liggende?
"På oppgavearket leste du om hvordan Bayes' setning kan være til nytte for å avgjøre om en e-post er soam eller en ordentlig melding. Vi skal her se på noen beregninger knyttet til dette.
Thomas Berg er en flittig bruker av e-post. Som mange andre er han plaget av spam. Mye spam er pornografisk og inneholder ordet "sex". For den e-posten Thomas mottar antar vi at
*2 % av den ordentlige e-posten inneholder ordet "sex"
*65 % av spammen inneholder ordet "sex"

Halvparten av den e-posten Thomas mottar, er ordentlige meldinger. Resten er spam.

b) Anta at meldingen inneholder ordet "sex". Vis at sannsynligheten er 97 % for at e-posten er spam."
Auto-n00b
Noether
Noether
Posts: 43
Joined: 27/03-2005 16:22

Glemte å logge inn før innlegget ovenfor. :oops:
Guest

Var dette en del av en heldagsprøve?
Auto-n00b
Noether
Noether
Posts: 43
Joined: 27/03-2005 16:22

Anonymous wrote:Var dette en del av en heldagsprøve?
Ja, det stemmer.
Guest

sikkert den jeg skal ha i morgen da, eller så er det bare akkurat den oppgaven som er plukket ut liksom. Fikk i allefall forberedelsesark for den oppgaven med spam-filteret
Post Reply