http://www.dagbladet.no/dinside/2003/04/25/367244.html, se på denne linken. Jeg har fått en oppgave på skolen, jeg skal tenke på hvordan det er mulig, under passende forutsetninger, å komme frem til den sannsynligheten som står her:
Graham nevner et eksempel. Dersom en epost inneholder ordet sex er det 97 prosent sannsynlig at det er en spam. Dersom den da ikke inneholder ord som sterkt indikerer at den er noe annet.
Kan noen hjelpe meg
Bayes og spam!
Moderators: Aleks855, Gustav, Nebuchadnezzar, Janhaa, DennisChristensen, Emilga
Denne mekanismen for å hindre spam er innebygget i f.eks Mozilla/Thunderbird mail programmet. I begynnelsen blir du først bedt om å markere spam som søppel, så blir thunderbird flinkere til å skille ut spam.
Thomas Bayes jobbet med statistikk problemer. Du kan finne ressurser om Thomas Bayes her:
http://en.wikipedia.org/wiki/Bayes
Noen artikler du kan lese om Bayesian spam filtre:
http://www.mozilla.org/mailnews/spam.html
http://www.paulgraham.com/spam.html
http://www.paulgraham.com/better.html
http://www.webopedia.com/TERM/B/Bayesian_filter.html
Thomas Bayes jobbet med statistikk problemer. Du kan finne ressurser om Thomas Bayes her:
http://en.wikipedia.org/wiki/Bayes
Noen artikler du kan lese om Bayesian spam filtre:
http://www.mozilla.org/mailnews/spam.html
http://www.paulgraham.com/spam.html
http://www.paulgraham.com/better.html
http://www.webopedia.com/TERM/B/Bayesian_filter.html
Last edited by mathvrak on 22/04-2005 00:07, edited 2 times in total.
Men hvis vi bare ser på den artikkelen, hvordan skal jeg forklare at han kom fram til det?? Skjønner ikke noe? Hjelp meg!
Jeg skal forklare hvordan han kom fram til at det er 97% sannsynlighet for at det er spam, dersom en e-post inneholder ordet sex. Hvordan skal jeg sette opp dette? Hvordan i huleste skal jeg finne det ut?
Jo, man kan det.Anonymous wrote:Kan du ikke bruke Bayes setning! Men vet ikke helt hva jeg skal kalle A og B osv??
Vi lar A være begivenheten at mailen er spam.
Vi lar B være begivenheten at mailen inneholder ordet "sex".
Vi skal da finne P(A|B), og vha. Bayes' setning får vi da:
P(A|B) = (P(B|A) * P(A))/P(B) = (0,650 * 0,500)/0,335 ~ 0,97 = 97 %.
Fra oppgaveteksten, som forøvrig minner latterlig mye om den Matte123 presenterte. Jeg antok derfor at det er snakk om den samme oppgaven som jeg har liggende her.Anonymous wrote:Bare et spørsmål, hvor får du tallene fra??
Beklager hvis tallene ikke stemmer.
"På oppgavearket leste du om hvordan Bayes' setning kan være til nytte for å avgjøre om en e-post er soam eller en ordentlig melding. Vi skal her se på noen beregninger knyttet til dette.TezzR wrote:Auto-n00b: Orker du å legge ut den oppgaveteksten fra oppgaven du har liggende?
Thomas Berg er en flittig bruker av e-post. Som mange andre er han plaget av spam. Mye spam er pornografisk og inneholder ordet "sex". For den e-posten Thomas mottar antar vi at
*2 % av den ordentlige e-posten inneholder ordet "sex"
*65 % av spammen inneholder ordet "sex"
Halvparten av den e-posten Thomas mottar, er ordentlige meldinger. Resten er spam.
b) Anta at meldingen inneholder ordet "sex". Vis at sannsynligheten er 97 % for at e-posten er spam."
sikkert den jeg skal ha i morgen da, eller så er det bare akkurat den oppgaven som er plukket ut liksom. Fikk i allefall forberedelsesark for den oppgaven med spam-filteret