Descripción
La rotación de personal se define como la fuga o salida de personal de la organización, se dice que es voluntaria cuando el personal decide salir y es involuntaria cuando es obligado a hacerlo.
Dentro de la organización, la rotación voluntaria es la más perjudicial, ya que se pierde potencial y talento humano, puede generar falta de capacidad de respuesta, pérdida de productividad, etc.; y es, por tanto, en la que más se debería investigar el por qué suceden, para ayudar a la organización a reaccionar ante estos eventos negativos.
Por esto es importante hacer una herramienta capaz de predecir con cierta certeza que y/o cuantas personas pueden renunciar con anticipación, esto para tener tiempo de hacer las planificaciones preventivas para evitar problemas futuros.
Herramientas
Los papers hacen una comparación de modelos para ver cual es mejor al momento de predecir.
- Regresión logística
Es un modelo lineal básico para la clasificación, funciona mejor al predecir variables dependientes binarias o categóricas.
- Naive Bayes
Es un clasificador cuyas virtudes son su simplicidad y buen rendimiento. Realiza una clasificación basada en las probabilidades obtenidas, con un supuesto básico de que todas las variables son condicionalmente independientes entre sí. Para estimar los parámetros (medias y variaciones de las variables) necesarios para la clasificación, el clasificador requiere solo una pequeña cantidad de datos de entrenamiento.
- Bosque Aleatorio
Es un modelo popular basado en árboles, se hacen conjuntos de árboles, en donde los árboles sucesivos no dependen de los anteriores, cada conjunto de árboles es entrenado por una parte diferente de los datos, al final para decir se hace una votación simple para ver qué valor salió más veces del total de conjuntos.
- Análisis discriminante lineal
El análisis discriminante implica la creación de una o más funciones discriminantes para maximizar la varianza entre las categorías en relación con la varianza con las categorías. El análisis discriminante lineal se explica como la obtención de una variable o puntuación z, que es una combinación lineal de dos o más variables independientes que discriminan mejor entre dos (o más) categorías o grupos diferentes.
- XGBoost
Es uno de los métodos más usados en la actualidad, da buenos resultados con poco esfuerzo. Utiliza el principio del boosting, donde genera múltiples modelos de predicción débiles de forma secuencial, donde cada uno toma el resultado del modelo anterior, para generar un modelo más fuerte con mayor poder predictivo. Lo más común es usar árboles de decisión como modelo de predicción débil.
- Redes neuronales
una red neuronal está diseñada para simular las operaciones del sistema nervioso. los elementos para su funcionamiento son valores de entrada, pesos asociados, funciones de activación y la salida. Sus en la predicción y clasificación son universales mientra se le de los datos suficientes.
Resultados
De los resultados obtenidos al usar los modelos, se clasifica el desempeño de los clasificadores según la curva ROC, aquí se observa que el modelos que mejor predice la rotación voluntaria de personal es la potenciación extrema de la gradiente con una mediana de 0.9462, seguida del bosque aleatorio con 0.9417 y la red neuronal con 0.8407. Esto se ve mejor en la siguiente tabla.

Conclusiones
Se puede concluir que el mejor método para predecir es la potenciación extrema de la gradiente o XG Boost, pero también depende de la cantidad de datos que se tiene para hacer una correcta predicción. También se puede usar los bosques aleatorios en la predicción, ya que comparando el rendimiento de ambos no son tan diferentes.
Referencias
- Punnoose, R., & Ajit, P. (2016). Prediction of Employee Turnover in Organizations using Machine Learning Algorithms A case for Extreme Gradient Boosting. International Journal of Advanced Research in Artificial Intelligence. Vol. 5, pp. 22-26
http://dx.doi.org/10.14569/IJARAI.2016.050904- Zhao Y., Hryniewicki M.K., Cheng F., Fu B. & Zhu X. (2019) Employee Turnover Prediction with Machine Learning: A Reliable Approach. Advances in Intelligent Systems and Computing, vol 869, pp. 737-758
https://doi.org/10.1007/978-3-030-01057-7_56