Hjem Sikkerhet Hva er bayesisk filter? - definisjon fra techopedia

Hva er bayesisk filter? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr Bayesian Filter?

Et bayesisk filter er et dataprogram som bruker Bayesian logikk eller Bayesian-analyse, som er synonyme termer. Det brukes til å evaluere overskriften og innholdet i e-postmeldinger og bestemme om det utgjør spam - uønsket e-post eller det elektroniske ekvivalentet til harddisk-bulk-post eller søppelpost. Et bayesisk filter brukes best sammen med antivirusprogrammer.

Techopedia forklarer Bayesian Filter

Et bayesisk filter fungerer med sannsynlighet for at bestemte ord vises i overskriften eller innholdet i en e-post. Visse ord indikerer stor sannsynlighet for at e-posten er spam, for eksempel Viagra og refinansiere. Filteret begynner ikke å vite sannsynligheten for at et ord indikerer stor sannsynlighet for spam. Brukere må identifisere e-posten manuelt som spam. Når nok forekomster av ordet blir funnet og e-postadressen blir identifisert som spam, lærer det Bayesiske filteret å identifisere ordet ved å bruke sannsynlighetsfunksjoner. Det gjør det samme med mange andre ord og uttrykk. Over tid blir det bayesiske filteret mer og mer effektivt til å identifisere spam for en bestemt bruker. Når sannsynligheten når en viss terskel, for eksempel 95 prosent, identifiseres e-posten som spam og flyttes ofte til en søppelmappe (eller noen ganger til og med slettes automatisk). Brukeren kan med jevne mellomrom se den og bestemme om den skal slettes eller ikke. Alternativt vil noen søppelprogrammer flytte den til en karantene hvor brukere kan se e-posten og se gjennom programvarens beslutning.

Innledende "trening" kan ofte foredles for å redusere falske positive eller falske negativer når det blir funnet feil dommer. Dette lar programvarens Bayesian-filter tilpasse seg spamens stadig utvikling.

Noen spamfiltre bruker også heuristikker sammen med det Bayesiske filteret. Forhåndsdefinerte regler blir satt opp av brukeren for å øke nøyaktigheten til å identifisere e-post som spam ytterligere. Disse reglene kan innebære antall forekomster av et gitt ord, eliminere eller ignorere nøytrale ord som "the", "a" eller "some" eller identifisere sekvenser av verk som "Viagra er bra for, " i motsetning til å anvende en sannsynlighet funksjon til alle fire individuelle ord.

Spammere kan bruke en teknikk som kalles Bayesian-forgiftning for å forringe effektiviteten til spamfilter ved bruk av Bayesian-filtrering. Noen teknikker inkluderer å injisere legitim tekst fra nyheter eller litterære kilder, ved å bruke tilfeldige uskyldige ord som sjelden finnes i spam eller til og med erstatte tekst med bilder.

Mange e-postklienter deaktiverer visning av bilder av sikkerhetsgrunner. Dermed kan spam komme til færre mottakere.

Et bayesisk filter ved hjelp av Bayesian-logikk kan brukes til å klassifisere alle slags data. Medisin, vitenskap og ingeniørfag har alle funnet bruksområder. Interessant nok har vitenskapelige forskere spekulert i at selv den menneskelige hjerne kan bruke Bayesiansk logikkmetodikk for å klassifisere stimuli og bestemme spesifikk responsatferd.

Hva er bayesisk filter? - definisjon fra techopedia