Entrada

Prediciendo el Riesgo de fuga de Empleados con Machine Learning

Sistema que usando Machine Learning con algoritmos de árboles de decisión, calcula la probabilidad de que un empleado abandone la compañía.

Índice

Introducción

Cuando un empleado decide abandonar una compañía, es importante saber cuál puede haber sido la causa, si se hubiesen podido implementar medidas preventivas y cuál ha sido el coste asociado, no solo por la pérdida de talento, sino también por el tiempo que requiere encontrar un sustituto.

Es por esto, que durante los últimos años, los modelos de análisis de datos, y más concretamente los modelos predictivos y de riesgo, han sido una herramienta muy útil para este tipo de problemas.

Recientemente, me inscribí en el curso “Mi primera semana” de Data Science For Business, muy recomendado y con una metodología y enfoque muy prácticos. El objetivo del mismo era crear un sistema con un Dashboard interactivo en Tableau, alimentado con algoritmos de Machine Learning, que permitiese identificar rápidamente las palancas de acción con las que evitar una fuga de empleados.

Análisis del Problema con Business Analytics

El primer paso en la fase de Business Analytics es identificar en qué punto nos encontramos actualmente, cuantificar el problema y generar insights que nos ayuden a entender mejor el problema. Esta fase nos servirá también para detectar aquellas palancas de acción y KPIs que nos permitan dirigir nuestra solución a la zona de lo realizable (feasible).

En nuestro caso, identificamos de los datos ficticios proporcionados en el curso, una tasa de abandono del 16% de los empleados, que traducido a coste monetario, según cifras de Center for American Progress, de 2’7M de dólares.

Haciendo un análisis de cúal es el perfil medio que abandona la compañía vemos que los que se encuentran en mayor riesgo son aquellos que:

  • No disponen de estudios superiories
  • Sin pareja
  • Pertenecen al departamento de ventas
  • Salarios bajos
  • Realizan horas extra

Business Analytics Estudios Figura 1: Abandonos por estudios

Business Analytics Puesto Figura 2: Abandonos por puesto

Con estos datos sobre la mesa, podemos preguntarnos cuál es ahorro esperado si aplicamos estrategias de retención sobre este primer perfil de riesgo que hemos identificado. Si nos proponemos el objetivo de reducir en un 30% el porcentaje de abandono sobre el departamento comercial, vemos que podemos retribuir directamente un ahorro de coste de unos 37.000$

Pero esto es únicamente una primera estrategia, ya que podemos seguir ahondando en el problema todo lo que queramos, y plantearnos preguntas como ¿Cuál es el coste medio de abandono por año? ¿Cuánto le ha costado a la compañía en el último año? Si aplicamos una estrategia a tres años, en el que cada año reducimos la tasa en un 10%, ¿cuánto habremos ahorrado a la compañía?

Implementación del Modelo de Machine Learning

Tras identificar el problema y visualizar las posibles soluciones, decidimos implementar una solución técnica, aplicando algoritmos de machine learning para predecir en base al histórico de datos de la compañía, cuál es el riesgo de abandono de un empleado a partir de su perfil.

Para este problema, utilizaremos los árboles de decisión debido a su interpretabilidad, que los hacen idóneos para poder comunicar de manera más fácil las posibles soluciones aplicar, y cuál es la razón más probable por la que un empleado puede que renuncie.

Machine Learning Tree Figura 3: Árbol de decisión

Productivización con Tableau

Finalmente, transformamos la salida de este algoritmo en un dashboard interactivo utilizando Tableau. Podéis consultar el resultado en el siguiente enlace Dashboard Turnover Risk

Producto Tableau Figura 4: Dashboard con Tableau

El código fuente utilizado para este curso, es propiedad de Data Science 4 Business.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.