Prediciendo el Riesgo de fuga de Empleados con Machine Learning
Sistema que usando Machine Learning con algoritmos de árboles de decisión, calcula la probabilidad de que un empleado abandone la compañía.
Índice
- Índice
- Introducción
- Análisis del Problema con Business Analytics
- Implementación del Modelo de Machine Learning
- Productivización con Tableau
Introducción
Cuando un empleado decide abandonar una compañía, es importante saber cuál puede haber sido la causa, si se hubiesen podido implementar medidas preventivas y cuál ha sido el coste asociado, no solo por la pérdida de talento, sino también por el tiempo que requiere encontrar un sustituto.
Es por esto, que durante los últimos años, los modelos de análisis de datos, y más concretamente los modelos predictivos y de riesgo, han sido una herramienta muy útil para este tipo de problemas.
Recientemente, me inscribí en el curso “Mi primera semana” de Data Science For Business, muy recomendado y con una metodología y enfoque muy prácticos. El objetivo del mismo era crear un sistema con un Dashboard interactivo en Tableau, alimentado con algoritmos de Machine Learning, que permitiese identificar rápidamente las palancas de acción con las que evitar una fuga de empleados.
Análisis del Problema con Business Analytics
El primer paso en la fase de Business Analytics es identificar en qué punto nos encontramos actualmente, cuantificar el problema y generar insights que nos ayuden a entender mejor el problema. Esta fase nos servirá también para detectar aquellas palancas de acción y KPIs que nos permitan dirigir nuestra solución a la zona de lo realizable (feasible).
En nuestro caso, identificamos de los datos ficticios proporcionados en el curso, una tasa de abandono del 16% de los empleados, que traducido a coste monetario, según cifras de Center for American Progress, de 2’7M de dólares.
Haciendo un análisis de cúal es el perfil medio que abandona la compañía vemos que los que se encuentran en mayor riesgo son aquellos que:
- No disponen de estudios superiories
- Sin pareja
- Pertenecen al departamento de ventas
- Salarios bajos
- Realizan horas extra
Figura 1: Abandonos por estudios
Figura 2: Abandonos por puesto
Con estos datos sobre la mesa, podemos preguntarnos cuál es ahorro esperado si aplicamos estrategias de retención sobre este primer perfil de riesgo que hemos identificado. Si nos proponemos el objetivo de reducir en un 30% el porcentaje de abandono sobre el departamento comercial, vemos que podemos retribuir directamente un ahorro de coste de unos 37.000$
Pero esto es únicamente una primera estrategia, ya que podemos seguir ahondando en el problema todo lo que queramos, y plantearnos preguntas como ¿Cuál es el coste medio de abandono por año? ¿Cuánto le ha costado a la compañía en el último año? Si aplicamos una estrategia a tres años, en el que cada año reducimos la tasa en un 10%, ¿cuánto habremos ahorrado a la compañía?
Implementación del Modelo de Machine Learning
Tras identificar el problema y visualizar las posibles soluciones, decidimos implementar una solución técnica, aplicando algoritmos de machine learning para predecir en base al histórico de datos de la compañía, cuál es el riesgo de abandono de un empleado a partir de su perfil.
Para este problema, utilizaremos los árboles de decisión debido a su interpretabilidad, que los hacen idóneos para poder comunicar de manera más fácil las posibles soluciones aplicar, y cuál es la razón más probable por la que un empleado puede que renuncie.
Productivización con Tableau
Finalmente, transformamos la salida de este algoritmo en un dashboard interactivo utilizando Tableau. Podéis consultar el resultado en el siguiente enlace Dashboard Turnover Risk
Figura 4: Dashboard con Tableau
El código fuente utilizado para este curso, es propiedad de Data Science 4 Business.