El filtro bayesiano es una herramienta muy eficaz para poder calcular la probabilidad de que ocurra un suceso determinado basándose en la experiencia de casos anteriores. Se basa en un método estadístico descubierto en el siglo XVIII por el clérigo y matemático Thomas Bayes, (1701-1761).
Esta es la manera en que funciona un filtro bayesiano:
- Una persona recibe un email y determina manualmente que se trata de un caso de spam.
- Se observa la frecuencia relativa de cada una de las palabras del mensaje.
- Se calcula su probabilidad de ocurrencia y se actualiza el filtro Bayesiano con esta información.
- Se realiza el mismo procedimiento con los mensajes que no son considerados como spam.
Cuando el filtro Bayesiano ya está entrenado, puede calcular automáticamente la probabilidad de que cada e-mail recibido sea spam en función de las palabras que contiene, por ejemplo: “viagra”, “gratis” o “enlarge”. Se le llama “spamicidad” al resultado y cuando supera el umbral del límite establecido (por ejemplo el 90%), se puede clasificar de manera segura como spam. Un filtro Bayesiano ofrece muy pocos falsos positivos, porque a diferencia de otros, ataca la esencia del problema de spam: el contenido del mensaje.
El método bayesiano es multilingüe e internacional y al ser adaptable, puede utilizarse con cualquier idioma.
Las más avanzadas soluciones en materia anti-spam incluyen un motor de filtro bayesiano de segunda generación, lo que supone no sólo un simple análisis de texto, sino también un amplio exámen de la forma y los atributos de los archivos adjuntos.