Tengo los siguientes datos:
Cuando el individuo "x" se unió a una empresa. Como los datos están limitados a 2 años, no conozco la fecha de inicio de cada individuo. Cuando el individuo "x" dejó la misma empresa. Si es "hoy", el individuo no ha dejado la empresa. Conozco la cantidad de ingresos generados por el individuo 'x' por día.
Tengo unos 500 individuos en total, es decir, x = 1,2,3,4....500.
Quiero determinar los ingresos medios de por vida de un individuo basándome en los datos que tengo.
Esto es lo que pensaba hacer: 1. 1. Considerar sólo a los individuos de los que tengo una "serie temporal de ingresos de por vida" completa (es decir, conocer la fecha de inicio/fin) 2. Obtener una distribución para estos datos 3. Tomar la media
El problema es que esto ignora a los individuos "leales" que pueden haber generado mucho dinero diariamente y que han estado en la empresa durante años y años. También puede sesgar la respuesta, ya que puede haber personas que empiecen o se vayan el mismo día (esto es habitual).
¿Cómo enfocarías este problema? La idea es seleccionar un grupo de individuos y seguirlos durante toda su vida para averiguar los ingresos. Creo que se trata de un tipo de análisis de supervivencia, pero no estoy seguro y necesito ayuda.