5/05/2017

RRHH y supervivencia: la importancia de la censura

Si en el post anterior hablábamos de zombis y de supervivencia, hoy vemos un caso práctico de análisis de la rotación de una empresa TIC, con su conjunto de datos incluido y un análisis con SPSS. Pero antes de ir a nuestro caso, tenemos que contar una historia de análisis de supervivencia.

Analizando la información que no vemos: Wald y los bombarderos Lancaster

Durante la segunda guerra mundial, una de las armas más letales de la campaña aérea aliada contra Alemania era el bombardero Lancaster de cuatro motores. Sin embargo, debido a su peso y velocidad lenta, los bombarderos sufrieron pérdidas muy altas de los combatientes nocturnos en Alemania. Según una estimación, las posibilidades de que una tripulación llegue al final de una gira de treinta misiones fue de alrededor del 25 por ciento.
Investigadores del Centro de Análisis Navales habían realizado un estudio de los daños causados a las aeronaves que habían regresado de las misiones.
En la figura 1, en el gráfico de la derecha, se ven las zonas más dañadas. Las marcadas con agujeros que representan a los impactos de bala.
Para mejorar la resistencia de los Lancaster, recomendaron que se añadieran armaduras a las zonas que presentaran el mayor daño.

Figura 1. Las zonas dañadas de los Lancaster que regresaron
Un matemático emigrado de Europa Oriental, Abraham Wald, encontró una solución completamente diferente al problema.
Ya hemos dicho que los analistas habían propuesto añadir armadura a las áreas de la aeronave que mostraron el mayor daño. Lo que Wald se dio cuenta fue que el daño sufrido por los aviones que regresaban a la base representaban áreas que no eran mortales para la supervivencia del avión.
El hecho de que hubiera áreas de los aviones intactas (la cabina y la cola) entre los aviones que habían regresado, le llevó a suponer que éstos eran precisamente los puntos más vulnerables de los bombarderos. Wald se dio cuenta de que el análisis de sus colegas era incorrecto porque omitía a los bombarderos que habían sido abatidos en Alemania: los que habían caído, y no podían analizar porque se habían estrellado en territorio aleman, eran los que habían recibido impactos en la cabina y la cola: los bombarderos que habían sido derribados no estaban presentes para la evaluación de daños.
Wald propuso, por tanto, que en lugar de otro reforzar las áreas donde los aviones de regreso regresaron, ya que esas eran las áreas que, cuando impactan las balas, hacían que el avión fuera abatido.
Una buena lección para el análisis de la supervivencia en People Analytics. Ahora vemos por qué.

Analizando la supervivencia sin olvidar la censura

Vayamos con una serie de esas preguntas a las que somos tan aficionados:
¿Cuál es la probabilidad de que una persona esté más allá de 127 semanas en la organización?
Ya vimos en el post sobre la métrica de oro para medir el valor de un empleado que, en el ejemplo que utilizábamos de la empresa TIC, es justo en la semana 127 de permanencia de un empleado cuando la empresa comienza a recuperar la inversión realizada con la nueva contratación.
Sabemos que sobrevivir en nuestro ejemplo significa no abandonar la empresa.
Entonces, ¿por qué expresar nuestros datos como una función de supervivencia (probabilidad de que sobreviva más allá de una fecha) y no simplemente tomar las medias y las desviaciones estándar?
El problema se debe a lo que se llama en análisis de supervivencia "casos censurados". Que son como los Lancaster que fueron abatidos y de los que no tenemos información completa. Algunos empleados de nuestro conjunto de datos no abandonan la empresa en el tiempo del estudio, es decir, antes del final del período de observación, que son 127 semanas.
Mucho cuidado con la palabra "censurado" porque no significa aquí lo mismo que en cine o la literatura. Si un sujeto no abandona la organización durante el tiempo de observación, se describe como censurado en un análisis de supervivencia. El sujeto es censurado en el sentido de que nada se observa o conoce sobre ese tema después del tiempo de la censura. Un sujeto censurado puede o no tener un evento después del final del tiempo de observación.
Cuando una persona no ha abandonado después de 127 semanas, no es ajustado computar 127 semanas para esa persona, porque no sabemos realmente cuánto permanecerá en la empresa. 
En otros casos, además, por bajas laborales largas, algunos empleados dejan de formar parte del estudio. Pero, lógicamente, no podemos inferir que su abandono se produce en el momento de la baja.
Ambos tipos (los que no abandonan y los que ya no estudiamos) componen los “casos censurados”. Si los incluimos, sin ningún tipo de ajuste para calcular un promedio de supervivencia, estaremos ofreciendo una cifra mal ajustada.

4. Caso práctico: Kaplan-Meier en acción para comparar la superviencia después de un jornada de onboarding

El método de Kaplan-Meier es uno de varios enfoques que nos permiten superar este problema, incorporando estos casos censurados al análisis.
Esencialmente, para cada punto de tiempo del que existen datos, el método de Kaplan-Meier estimará la probabilidad de sobrevivir (es decir, no experimentar el evento del abandono) más allá de ese punto de tiempo particular teniendo en cuenta la presencia de casos censurados.
Este caso práctico es de una empresa TIC.
Hemos seleccionado dentro de esta empresa el segmento de los trabajadores de TIC que trabajan en cliente, es decir, lo que trabajan en modo “outsourcing” de toda la vida.
El análisis está hecho con SPSS: probablemente el camino más rápido para hacer un análisis de supervivencia. No vamos a explicar en este post todo el proceso. Es es más como para un máster de People Analytics (¡perdonad por hablar de mi libro!). Nos quedamos con el análisis de los resultados.
Tenemos para nuestro análisis de supervivencia dos grupos de 50 personas. Ambos grupos son personas de TIC que trabajan en cliente (en outsourcing, vamos). El plazo de permanencia que hemos planteado para el estudio es de 127 semanas.
A 50 personas del mismo grupo de TIC-outsourcing se les ofreció una jornada completa de presentación de la compañía al incorporarse a la organización. Kaplan-Meier nos permite comparar los resultados de este grupo, con el grupo de control, el que no ha asistido a la jornada de onboarding.

Vemos que en el grupo de Onboarding, de 50 personas, 30 han abandonado y 20 han sido censurados: 1 abandono por baja larga (lo vemos en el gráfico de abajo) y 29 que han llegado a las 127 semanas.
En el grupo de control 37 personas han abandonado y de los 13 censurados, 11 han llegado a las 127 semanas.
En la figura 2 los casos censurados aparecen marcados con una cruz. En el grupo de control se ven los 2 casos censurados antes de la semana 127 y los 11 supervivientes censurados al final de la semana 127. En el grupo de onboarding hay 1 caso censurado antes de la semana 127.
Esta tabla que viene a continuación muestra las medianas que corresponden a los dos grupos. La media, como hemos dicho más arriba, no responde bien a los cálculos de supervivencia.
Los resultados son bien significativos. El grupo de onboarding tiene una mediana de 69 semanas y una variabilidad mayor (hay un 95% de posibilidades de que su permanencia vaya de 14 semanas a 123 semanas.

Figura 2. La superviviencia de los dos grupos (control y con onboarding). Los casos censurados aparecen marcados con una cruz.
En el grupo de control se ven los 2 casos censurados antes de la semana 127 y los 11 supervivientes censurados al final de la semana 127. En el grupo de onboarding hay 1 caso censurado antes de la semana 127.
Esta tabla de abajo se muestran las medianas que corresponden a los dos grupos. La media, como hemos dicho más arriba, no responde bien a los cálculos de supervivencia.
Los resultados son bien significativos. El grupo de onboarding tiene una mediana de 69 semanas y una variabilidad mayor (hay un 95% de posibilidades de que su permanencia vaya de 14 semanas a 123 semanas.
En el grupo de control la mediana es de 9 semanas. La variabilidad es mucho menor: hay un 95% de posibilidades de que su permanencia vaya de 14 semanas a 123 semanas. 

Finalmente se realizó una prueba de log rank para determinar si había diferencias en la distribución de supervivencia para el grupo con onboarding y el grupo de control. Las distribuciones de supervivencia para las dos intervenciones fueron significativamente diferentes, χ2 (2) = 5,421, p < 0,02

Es decir, la jornada de onboarding tiene un impacto positivo en la supervivencia. Este impacto positivo es muy poco probable de que se deba a la casualidad: sólo hay una posibilidad entre 50 de que así sea.

Conclusión como para hacer un reporte Pro

Este es el tipo de reporte que podríamos hacer por escrito, como para quedar en plan profesional.
Los participantes fueron asignados aleatoriamente a 2 intervenciones diferentes para evaluara el impacto del onboarding en la supervivencia: una jornada de onboarding (n = 50) y un grupo de control (n = 50).
El análisis de supervivencia de Kaplan-Meier (Kaplan & Meier, 1958) se realizó para comparar las dos intervenciones para su efectividad en el abandono.
Un porcentaje ligeramente diferente de casos censurados estuvo presente en los grupos de intervención de jornada de onboarding (40,0%), frente a la del grupo de control (26,0%) y el patrón de censura fue similar.
Los participantes que se sometieron al programa de onboarding tuvieron una mediana de tiempo de supervivencia de 69 semanas, con una variabilidad más alta: con un intervalo de confianza del 95% sobrevivirían entre 14 y 123 semanas
La supervivencia es sensiblemente mayor que la del grupo de control (los que no tuvieron jornada de onboarding), que tuvieron una mediana de 9 semanas, con una variabilidad menor: con un intervalo de confianza del 95% sobrevivirían entre 5 y 12 semanas.
Se realizó un test de log rank para determinar si había diferencias estadísticamente significativas en la distribución de supervivencia para los dos tipos de intervención.
La distribución de supervivencia para las dos intervenciones fueron estadísticamente diferentes, sólo hay una posibilidad entre 50 de que esta diferencia entre los dos grupos se deba a la casualidad y por tanto, podemos concluir que la jornada de onboarding tiene un impacto positivo en la supervivencia. 
Un consejo final: como me gusta que me entiendan, dejaría este argot estadístico para el informe y explicaría los datos paso a paso, en directo, mirando a los ojos y evitando cualquier palabro que expulse la mente de la audiencia hacia el espacio exterior mientras que su cuerpo permanece en la sala.
=======================================================
People Analytics Pro es el primer máster que enseña a los profesionales de RRHH a dominar las técnicas analíticas necesarias para evaluar y resolver problemas de sus área de desempeño como reclutamiento, gestión del talento, compensación o retención.