Page 1 of 2
Bayes og spam!
Posted: 21/04-2005 23:00
by Matte123
http://www.dagbladet.no/dinside/2003/04/25/367244.html, se på denne linken. Jeg har fått en oppgave på skolen, jeg skal tenke på hvordan det er mulig, under passende forutsetninger, å komme frem til den sannsynligheten som står her:
Graham nevner et eksempel. Dersom en epost inneholder ordet sex er det 97 prosent sannsynlig at det er en spam. Dersom den da ikke inneholder ord som sterkt indikerer at den er noe annet.
Kan noen hjelpe meg
Posted: 21/04-2005 23:56
by mathvrak
Denne mekanismen for å hindre spam er innebygget i f.eks Mozilla/Thunderbird mail programmet. I begynnelsen blir du først bedt om å markere spam som søppel, så blir thunderbird flinkere til å skille ut spam.
Thomas Bayes jobbet med statistikk problemer. Du kan finne ressurser om Thomas Bayes her:
http://en.wikipedia.org/wiki/Bayes
Noen artikler du kan lese om Bayesian spam filtre:
http://www.mozilla.org/mailnews/spam.html
http://www.paulgraham.com/spam.html
http://www.paulgraham.com/better.html
http://www.webopedia.com/TERM/B/Bayesian_filter.html
Posted: 21/04-2005 23:59
by Guest
Må bare fjerne kommaet etter linken, så fungerer den ypperlig.
Posted: 22/04-2005 11:27
by Guest
Men hvis vi bare ser på den artikkelen, hvordan skal jeg forklare at han kom fram til det?? Skjønner ikke noe? Hjelp meg!
Posted: 22/04-2005 11:45
by Matte123
Jeg skal forklare hvordan han kom fram til at det er 97% sannsynlighet for at det er spam, dersom en e-post inneholder ordet sex. Hvordan skal jeg sette opp dette? Hvordan i huleste skal jeg finne det ut?
Posted: 22/04-2005 15:01
by Guest
Kan du ikke bruke Bayes setning! Men vet ikke helt hva jeg skal kalle A og B osv??
Posted: 22/04-2005 18:28
by Auto-n00b
Anonymous wrote:Kan du ikke bruke Bayes setning! Men vet ikke helt hva jeg skal kalle A og B osv??
Jo, man kan det.
Vi lar A være begivenheten at mailen er spam.
Vi lar B være begivenheten at mailen inneholder ordet "sex".
Vi skal da finne P(A|B), og vha. Bayes' setning får vi da:
P(A|B) = (P(B|A) * P(A))/P(B) = (0,650 * 0,500)/0,335 ~ 0,97 =
97 %.
Posted: 22/04-2005 19:26
by Guest
Bare et spørsmål, hvor får du tallene fra??
Posted: 22/04-2005 20:17
by Auto-n00b
Anonymous wrote:Bare et spørsmål, hvor får du tallene fra??
Fra oppgaveteksten, som forøvrig minner latterlig mye om den Matte123 presenterte. Jeg antok derfor at det er snakk om den samme oppgaven som jeg har liggende her.
Beklager hvis tallene ikke stemmer.
Posted: 24/04-2005 15:28
by TezzR
Auto-n00b: Orker du å legge ut den oppgaveteksten fra oppgaven du har liggende?
Posted: 24/04-2005 21:12
by Guest
TezzR wrote:Auto-n00b: Orker du å legge ut den oppgaveteksten fra oppgaven du har liggende?
"På oppgavearket leste du om hvordan Bayes' setning kan være til nytte for å avgjøre om en e-post er soam eller en ordentlig melding. Vi skal her se på noen beregninger knyttet til dette.
Thomas Berg er en flittig bruker av e-post. Som mange andre er han plaget av spam. Mye spam er pornografisk og inneholder ordet "sex". For den e-posten Thomas mottar antar vi at
*2 % av den ordentlige e-posten inneholder ordet "sex"
*65 % av spammen inneholder ordet "sex"
Halvparten av den e-posten Thomas mottar, er ordentlige meldinger. Resten er spam.
b) Anta at meldingen inneholder ordet "sex". Vis at sannsynligheten er 97 % for at e-posten er spam."
Posted: 24/04-2005 21:14
by Auto-n00b
Glemte å logge inn før innlegget ovenfor.

Posted: 24/04-2005 21:33
by Guest
Var dette en del av en heldagsprøve?
Posted: 24/04-2005 22:59
by Auto-n00b
Anonymous wrote:Var dette en del av en heldagsprøve?
Ja, det stemmer.
Posted: 24/04-2005 23:02
by Guest
sikkert den jeg skal ha i morgen da, eller så er det bare akkurat den oppgaven som er plukket ut liksom. Fikk i allefall forberedelsesark for den oppgaven med spam-filteret