5 votos

Utilice los botones en lugar de simples anclajes.

Muchos trabajos de investigación en salud basado en la observación de datos utilizar el siguiente formato:

¿Una causa B?

  1. la prueba t de a vs B (o chi-cuadrado, o cualquier otra prueba de la dependencia entre dos variables)
  2. de regresión múltiple de B en a, ajustado por sospecha de factores de confusión
  3. hacer inferencias heroica

¿Por qué es la aparente "estándar" para la primera ejecución de la prueba de t (o lo que sea) en lugar de la simple ejecución de la análogos sin corregir modelo lineal, que puede ser más claramente en comparación con el multivariable modelo lineal de interés? ¿Hay alguna otra ventaja de hacerlo de la manera "estándar" de que me estoy perdiendo?

3voto

James Sutherland Puntos 2033

Considerar dos situaciones: Una es aleatorio y no aleatorio.

Si es aleatorio, a continuación, la sabiduría convencional es la aleatorización asegura que la falta de prejuicios y la posterior regresión de ajuste no duele y puede ayudar a estimar la precisión. En contra de que Freedman's 'En la regresión de ajustes de los datos experimentales', sostiene que los ajustes que puede introducir un sesgo en muestras pequeñas y aumentar o misspecify estimación de la precisión. Lin 2013 (paywalled) proporciona una útil discusión de esta disputa, que se resumen de manera informal aquí, detallando las circunstancias en que la regresión de los ajustes funcionan bien. Y en los comentarios a esta respuesta @frank-harrell notas que la regresión de ajuste, a veces incluso necesario para obtener una evaluación imparcial y efecto de estimar. (Tanto peor para no ajustado las estimaciones y la inicial de la prueba t...)

En cualquier caso, los Freedman del lado de este debate tienden a requerir y aprecian tener una prueba t para las diferencias en la B como una función de Una y generalmente estar dispuesto a ignorar modelado posterior.

Si no aleatorizado, a continuación, usted debe, en circunstancias normales esperar de confusión - ¿por qué otra cosa hacer la regresión múltiple? En ese caso yo no veo ningún punto a la construcción de un modelo por ejemplo, el simple modelo lineal para que el t-test es una prueba, que tiene una estimación de que en adelantado que usted no espera que para identificar el efecto causal de a en B. Y, a continuación, hay la precisión de las consideraciones que se indicó anteriormente. Parece más sensato de corte recto a la tarea de identificar a ese efecto por tratar de controlar estadísticamente por sus factores de confusión.

Parece ser una mejor idea de utilizar el espacio de la prueba t-test se llevó a variar la lista de factores de confusión en la manera que abarque el conjunto de la teoría razonable historias acerca de lo que confunde y cómo lo hace.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X