Tengo un conjunto de datos que intento utilizar para predecir el resultado de un paciente basándome en un montón de factores relacionados con la atención del paciente. Una de las variables independientes es un número de identificación único del médico de atención primaria. Además de esa variable, tengo algunos atributos sobre el médico de atención primaria, como su edad y sexo. No me preocupa tanto medir los efectos de la edad y el sexo en el resultado, sino asegurarme de tener en cuenta la variabilidad debida a ellos durante el análisis. Mi pregunta es, ¿es necesario siquiera incluir estos atributos del médico (edad y sexo) en mi análisis, o se tendrán en cuenta automáticamente al incluir un término de identificación del médico en mi análisis? Me parece que si incluyo un término de identificación del médico en el modelo, se tendrán en cuenta todos los atributos del médico. características relacionados con ese médico, por lo que no necesitaría incluirlos por separado. ¿Es correcta mi intuición?
Si otro título es más apropiado, por favor hágamelo saber. No estoy muy seguro de cómo se llama este problema (y por lo tanto no podía buscar otros mensajes como este).