Estoy de acuerdo con Noé; en realidad no es una técnica estadística de la pregunta en sí. Hay varias preguntas que usted necesita para tener una respuesta clara.
¿Tiene usted un "coherente" percepción subjetiva?
Vamos a decir que su formación los datos provienen de una opinión de un empleado existente, la evaluación de un nuevo empleado va a tener la misma opinión? Es realmente problemático, si no son contrarias opiniones y calificaciones después de la fase de implementación de su modelo y si es así, no se puede inferir el desempeño de la función más. Creo que este es probablemente el más problemático suposición, si usted decidió que la utilice.
¿Qué es el modelado objetivo?
Si el objetivo es maximizar la capacidad de predicción del modelo único, usted tiene una razón legítima para usar.
Es allí cualquier otro negocio restricción?
A veces, incluso si usted tiene un predictor significativo, no se puede usar debido a que algunos de negocio y restricciones legales. Por ejemplo, si se va a construir un modelo de crédito para predecir el valor predeterminado de los préstamos en el sector financiero, no se puede utilizar la edad y el sexo (en los EE.UU.), etc...
Es ético para incluir la variable?
Esta pregunta probablemente pone a su modelado estándar más alto; depende del contexto de su dominio de la empresa.
Posible solución:
Es posible obtener una estimación a partir de otra variable? Por ejemplo, ¿tienes la dirección de los donantes? Si es así, utilice las direcciones como una variable intermedia y obtener una estimación del valor neto de los donantes (por Zillow Zestimate) puede ser una buena idea.
P. S. No es un tema de regresión paso a paso; usted debe comprobar fuera de la post aquí