Miembros:
- Wilson Ibarra Apaza
- Franklin Barrios Apaza
- Javier Rosado Carrizo
- Kenin Ojeda Hidalgo
Resumen: El presente trabajo desarrolla un modelo predictivo de churn para el sector telecomunicaciones, utilizando técnicas de aprendizaje supervisado. A partir de un conjunto real de 100,000 registros de clientes, se aplicaron procesos de análisis exploratorio, limpieza y normalización de datos mediante Z-score, eliminando 2,028 outliers para mejorar la calidad del entrenamiento. Se entrenaron y evaluaron cuatro modelos de clasificación: Árbol de Decisión, Random Forest, XGBoost y Red Neuronal Multicapa (MLP).
El modelo XGBoost fue seleccionado como solución final por su alta precisión en la detección de churn (94 %), un F1-score de 96%, un AUC-ROC de 0.98 y un accuracy del 95 %.
Además, su configuración fue optimizada mediante GridSearchCV, logrando un equilibrio adecuado entre rendimiento y capacidad de generalización. El análisis de importancia de atributos reveló que variables como la morosidad, la disminución de consumo, los tickets generados, los reclamos frecuentes y la zona geográfica del cliente influyen significativamente en la predicción del abandono.
Este modelo representa una herramienta eficaz y viable para anticipar el churn y orientar estrategias de retención
personalizadas en contextos reales.
Palabras clave: churn, machine learning, MLP, GridSearchCV
Predicción de cancelación de servicios de clientes del sector de telecomunicaciones en el Perú
Predicción de cancelación de servicios de clientes del sector de telecomunicaciones en el Perú
- Adjuntos
-
- codigo_fuente_y_dataset.zip
- (2.53 MiB) Descargado 13 veces
-
-