Troomes

TRABAJO FINAL - APLICACIÓN DE FILTRADO INTELIGENTE DE CORREOS NO DESEADOS MEDIANTE TÉCNICAS DE MACHINE LEARNING PARA DETECCIÓN AUTOMÁTICA DE SPAM

Integrantes

- Cordova Cesar
- Quispe Christian
- Salas Oscar
- Villano, Raul

Resumen. Se ha desarrollado un sistema de clasificación de spam basado en Machine Learning para la empresa peruana Codaerus. El proyecto procesa correos electrónicos, esto incluye la extracción y limpieza de texto (eliminación de HTML, stopwords y stemming), vectorización con CountVectorizer, y la aplicación de un modelo de regresión logística, logrando un 90.8% de precisión en validación con una división estratificada 70/15/15 (entrenamiento / validación / prueba). Como puntos resaltantes: el proyecto cuenta con un manejo adecuado de emails complejos con múltiples formatos, el procesamiento es especializado para el idioma español, y su implementación modular permite reproducción y escalabilidad, estableciendo una base sólida para aplicaciones reales de filtrado automático de correo no deseado.

Los modelos empleados en el proyecto son: Regresión Logística, Support Vector Machine, Naive Bayes, Multinomial, Bernoulli y Gaussian.

Keywords—Email, Multinomial Naive Bayes, Support Vector Machine, Recurrent Neural Network, Spam classification

Troomes

Trabajo final de curso de Machine Learning

Trabajo final de curso de Machine Learning