Quelli di noi tormentati dall';assalto di decine, se non centinaia di e-mail indesiderate che ci salutano mentre apriamo i nostri account e-mail, hanno qualche speranza di tregua sotto forma di filtri spam bayesiani. Per anni gli spammer sono stati in grado di rimanere un passo avanti ai bloccanti dello spam semplicemente per la loro creatività e capacità di adeguarsi ed eludere il blocco ogni volta che veniva sviluppato un nuovo filtro anti-spam. Di conseguenza, gli sviluppatori di software antispam erano certi del compito prima di loro; sviluppare software in grado di apprendere continuamente dalle nuove tecniche creative degli spammer e di conseguenza non rimanere indietro nel gioco di blocco dello spam.
IAML5.12: Naive Bayes per il rilevamento di spam
Solo di recente, una tale soluzione è stata sviluppata sotto forma di filtri bayesiani. Il metodo statistico bayesiano, su cui si basano i filtri, funziona sulla premessa di dividere le email in categorie. Il software registra le e-mail che hai scelto di aprire e quelle che hai semplicemente eliminato. Per tutto il tempo, monitora le caratteristiche di entrambe le email che hai aperto e quelle che non hai. Nel tempo, impara da queste cifre aggregate. Riconoscerà certe parole che appaiono frequentemente in quelle e-mail che ignorate costantemente. Il software sarà quindi più incline a classificare le e-mail con un';alta frequenza di quella particolare parola come spam.
Ma per timore di non aprire poche e-mail da tua zia Sue, tutte le e-mail con la parola :Sue: saranno improvvisamente classificate come spam, dovresti sapere che i filtri bayesiani funzionano nel complesso. Ciò significa che, mentre le decisioni su quali e-mail aprire e quali no influenzeranno l';algoritmo, anche le attività di migliaia se non decine di migliaia di altri utenti. Diffusa in un gruppo così ampio di utenti e aggregando i dati in un tale periodo, c';è solo il minimo rischio di false etichettature. Piuttosto, quello che ottieni è uno strumento a lungo termine molto accurato per bloccare lo spam. Sfortunatamente, quelle stesse caratteristiche che impediscono il blocco falso limitano anche il filtro antispam bayesiano dal bloccare l';ondata frontale di una nuova tecnica di spamming. Quindi, spesso l';effetto è di alcuni giorni o settimane di una nuova tecnica nello spamming che scorre furtivamente attraverso le fessure finché non viene elaborato nell';algoritmo.
Per lo stesso motivo, tuttavia, uno dei grandi vantaggi dei filtri antispam bayesiani è che possono essere personalizzati. Se ricevi una quantità sproporzionata di spam in base ai tuoi interessi online, puoi effettivamente modificare un blocco di spam bayesiano per trattare determinate parole che ti sono particolarmente spammanti. Vale a dire, che mentre un filtro bayesiano non è pronto a evitare un blocco eccessivo, quando viene richiesto dall';utente, il software può essere utilizzato per bloccare qualsiasi tipo specifico di e-mail di spam.
Solo di recente la tecnologia è diventata commercialmente disponibile. Attualmente è offerto in un numero limitato di programmi anti-spam che possono essere acquistati e che scansionano ogni pezzo di e-mail prima che venga aperto. L';altra forma è quella che è effettivamente incorporata nel software del server di posta stessa, il che significa che le e-mail del cliente sono già scansionate e classificate anche prima che lui o lei apra il loro provider di posta elettronica