TRABAJO FINAL - APLICACIÓN DE FILTRADO INTELIGENTE DE CORREOS NO DESEADOS MEDIANTE TÉCNICAS DE MACHINE LEARNING PARA DETECCIÓN AUTOMÁTICA DE SPAM
Integrantes
- Cordova Cesar
- Quispe Christian
- Salas Oscar
- Villano, Raul
Resumen. Se ha desarrollado un sistema de clasificación de spam basado en Machine Learning para la empresa peruana Codaerus. El proyecto procesa correos electrónicos, esto incluye la extracción y limpieza de texto (eliminación de HTML, stopwords y stemming), vectorización con CountVectorizer, y la aplicación de un modelo de regresión logística, logrando un 90.8% de precisión en validación con una división estratificada 70/15/15 (entrenamiento / validación / prueba). Como puntos resaltantes: el proyecto cuenta con un manejo adecuado de emails complejos con múltiples formatos, el procesamiento es especializado para el idioma español, y su implementación modular permite reproducción y escalabilidad, estableciendo una base sólida para aplicaciones reales de filtrado automático de correo no deseado.
Los modelos empleados en el proyecto son: Regresión Logística, Support Vector Machine, Naive Bayes, Multinomial, Bernoulli y Gaussian.
Keywords—Email, Multinomial Naive Bayes, Support Vector Machine, Recurrent Neural Network, Spam classification
Trabajo final de curso de Machine Learning
-
cesar.cordova

- Mensajes: 1
- Registrado: 14 Ene 2026, 21:42