4 votos

¿Puedo omitir determinadas variables que podrían tenerse en cuenta?

Tengo un conjunto de datos que intento utilizar para predecir el resultado de un paciente basándome en un montón de factores relacionados con la atención del paciente. Una de las variables independientes es un número de identificación único del médico de atención primaria. Además de esa variable, tengo algunos atributos sobre el médico de atención primaria, como su edad y sexo. No me preocupa tanto medir los efectos de la edad y el sexo en el resultado, sino asegurarme de tener en cuenta la variabilidad debida a ellos durante el análisis. Mi pregunta es, ¿es necesario siquiera incluir estos atributos del médico (edad y sexo) en mi análisis, o se tendrán en cuenta automáticamente al incluir un término de identificación del médico en mi análisis? Me parece que si incluyo un término de identificación del médico en el modelo, se tendrán en cuenta todos los atributos del médico. características relacionados con ese médico, por lo que no necesitaría incluirlos por separado. ¿Es correcta mi intuición?

Si otro título es más apropiado, por favor hágamelo saber. No estoy muy seguro de cómo se llama este problema (y por lo tanto no podía buscar otros mensajes como este).

3voto

eldering Puntos 3814

En su pregunta dice

Tengo algunos atributos sobre el médico de atención primaria, como su edad y sexo. No me preocupa tanto medir los efectos de la edad y el sexo en el resultado, sino asegurarme de tener en cuenta la variabilidad debida a ellos durante el análisis.

Si le interpreto correctamente, entonces creo, Sin embargo, conviene incluir los demás efectos en el modelo.

Como usted afirma, un "médico" puede considerarse un conjunto complejo de rasgos y características que, en conjunto, caracterizan a ese médico concreto. Dos de estas características son la edad y el sexo. Si se incluyen en el modelo la identificación del médico (como factor), su edad y su sexo, el parámetro de cada médico mide el efecto de ese médico en el resultado. tras tener en cuenta el efecto de la edad y el sexo . Si no se incluye la edad y el sexo, se está contabilizando todos los posibles efectos en un solo lugar, y no podrá desitnagarlos.

Como comentario adicional, este parece un lugar excelente para ajustar, no un modelo lineal clásico, sino un modelo lineal multinivel . Un problema estadístico que seguramente encontrará es que los distintos médicos tendrán un número diferente de pacientes/observaciones. Esto significa que algunos médicos, que están relativamente poco representados en los datos, tendrán un parámetro estimado muy impreciso (es decir, con una varianza muy alta). Un modelo lineal clásico no intenta rectificar esto, pero un modelo multinivel sí lo hace (reduciendo las estimaciones de confianza bajas).

En R Esto se vería así

M <- lmer(outcome ~ gender + age + (1 | doctor_id), ...)

La referencia estándar (y muy amigable) sobre modelos multinivel es Gelman y Hill No deje de visitarlo.

0voto

Tony Puntos 871

Resumen : Depende de lo que quieras saber, pero yo diría que omitas los ID.

(Asumo que tiene representado a cada médico para varias muestras en su conjunto de datos).

Si decide omitir las características del médico e incluir en su lugar el ID del médico, estará modelando el resultado en función del médico que trató al paciente. Aunque esto puede ser interesante si conoce al médico, no responde a ninguna pregunta general.

Así que, a menos que conozca a los médicos de una forma que no esté recogida en el conjunto de datos y quiera saber cuál es mejor que el resto, yo excluiría el doctorID y me decantaría por las características genéricas de los médicos. ¿Por qué? Porque como científicos estamos mucho más interesados en saber qué genérico atributos -como el sexo y la edad- son importantes para un resultado, en lugar de centrarse en variables específicas de cada caso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X