Bo Kolstrup

Logo

Científico de Datos con experiencia en modelos predictivos y análisis de datos

View the Project on GitHub Bokols/Prediccion_de_la_Perdida_de_Clientes_para_Interconnect

Descripción del Proyecto: Predicción de la Pérdida de Clientes para Interconnect

Introducción

Este proyecto tiene como objetivo predecir la pérdida de clientes para Interconnect, una empresa de telecomunicaciones, utilizando técnicas de aprendizaje automático. La predicción de la pérdida de clientes es crucial para las empresas en industrias competitivas, ya que les permite identificar a los clientes con alto riesgo de abandonar y tomar medidas proactivas para retenerlos. El objetivo de este proyecto fue construir un modelo predictivo capaz de prever la pérdida de clientes con precisión, basado en varias fuentes de datos relacionadas con el comportamiento de los clientes, contratos y uso de servicios.

Resumen de los Procedimientos

El proyecto involucró varios pasos clave: recopilación de datos, preprocesamiento, análisis exploratorio de datos (EDA), selección y evaluación del modelo. A continuación se presenta un resumen de los pasos tomados durante el proyecto.

1. Recopilación de Datos

El proyecto comenzó con la recopilación de cuatro conjuntos de datos principales, los cuales fueron necesarios para comprender los diversos aspectos del comportamiento de los clientes:

2. Preprocesamiento de Datos

Se limpiaron y transformaron los datos para asegurar que fueran adecuados para el aprendizaje automático. Los principales pasos de preprocesamiento fueron:

3. Análisis Exploratorio de Datos (EDA)

Se realizó un análisis exploratorio de datos para descubrir patrones e información oculta en los datos. Los principales objetivos del EDA fueron:

4. Selección y Entrenamiento del Modelo

Se probaron y compararon varios modelos de aprendizaje automático para determinar el más eficaz para predecir la pérdida de clientes. Los modelos probados incluyeron:

5. Evaluación del Modelo

Cada modelo fue evaluado utilizando varias métricas clave para determinar su precisión y efectividad:

6. Selección del Modelo Final

Después de probar varios modelos, se seleccionó Random Forest como el modelo final debido a su rendimiento robusto en diversas métricas. El rendimiento del modelo se evaluó en el conjunto de prueba, y los resultados se resumen a continuación.

Hallazgos

Métricas de Rendimiento del Modelo

Matriz de Confusión

La capacidad del modelo para captar la mayoría de los clientes que realmente se dan de baja es evidente, aunque algunas predicciones falsas podrían generar acciones de retención innecesarias o, por el contrario, la pérdida de oportunidades para retener a los clientes que realmente quieren irse.

Conclusión

El proyecto logró desarrollar un modelo de aprendizaje automático para predecir la pérdida de clientes para Interconnect. El modelo Random Forest demostró un rendimiento sólido, logrando un AUC-ROC de 0.86, precisión de 0.91 y puntuación F1 de 0.81. Estos resultados sugieren que el modelo es eficaz para predecir la pérdida de clientes y puede respaldar las estrategias de retención de Interconnect.

Sin embargo, existen áreas de mejora. El índice de recuperación de 0.74 indica que algunos clientes que se darían de baja no fueron detectados por el modelo, lo que podría generar oportunidades perdidas para la retención. El trabajo futuro debería centrarse en mejorar la recuperación, posiblemente mediante el uso de técnicas avanzadas como SMOTE para equilibrar las clases o refinando los hiperparámetros del modelo.

En general, el modelo proporciona una base sólida para identificar a los clientes con alto riesgo de pérdida y facilitar esfuerzos de retención dirigidos, pero se necesita un monitoreo continuo y optimización para mantener y mejorar su rendimiento.