8 votos

¿Por qué es el poder de análisis con regresión logística tan liberal en comparación con el chi cuadrado?

Estoy llevando a cabo un análisis de la potencia para obtener el tamaño de muestra requerido para un estudio, básicamente, en comparación expuestos / no expuestos con la mortalidad a 30 días como resultado. Voy a comprobar tasas de mortalidad brutas con chi-cuadrado, sino también el uso de la regresión logística con probables factores de confusión.

Al ejecutar un análisis del poder de potencia de 0.8, nivel de significación de 0,05, el tamaño del efecto 0,15% y un estimado de 10 factores de confusión puedo conseguir que me haría falta sólo n=117 que parecen muy pequeñas. comparando con chi-cuadrado indican que me había necesidad de 350.

Estoy usando R y pwr:

pwr.f2.test(u=10, v=NULL, f2=0.15, sig.level=0.05, power=0.8)
pwr.chisq.test(w=0.15, N=NULL, df=1 , sig.level=0.05, power=0.8 )

Es esta predicción o estoy mal uso de esto?

9voto

Brandon Grossutti Puntos 140

Las dos pruebas (regresión logística y de chi-cuadrado) son equivalentes y un análisis del poder debe dar la misma respuesta.

Usted está asumiendo que un valor de 0,15 para f2 y w son el mismo tamaño del efecto, no lo son. Un pequeño valor de w es de 0,1, un pequeño valor de f2 es de 0.02.

cohen.ES(test=c("chisq"), size=c("small"))
cohen.ES(test=c("f2"),    size=c("small"))

Edit: Elaborado sobre la similitud de los dos enfoques.

SI usted le da los mismos datos para la regresión logística y una prueba de chi-cuadrado (estrictamente: sin la corrección de Yates), se obtiene el mismo resultado. He aquí un ejemplo

> set.seed(1234)
> x <- rbinom(100, 1, 0.2) 
> y <- rbinom(100, 1, 0.2) 
> chisq.test(table(x, y), correct=FALSE)

    Pearson's Chi-squared test #'

data:  table(x, y)
X-squared = 0.155, df = 1, p-value = **0.694**

Warning message:
In chisq.test(table(x, y), correct = FALSE) :
  Chi-squared approximation may be incorrect
> summary(glm(y ~ x, family="binomial"))

Call:
glm(formula = y ~ x, family = "binomial")

Deviance Residuals: 
   Min      1Q  Median      3Q     Max  
-0.753  -0.753  -0.753  -0.668   1.794  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   -1.114      0.251   -4.43  9.4e-06 ***
x             -0.272      0.693   -0.39     **0.69**    
---
Signif. codes:  0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 110.22  on 99  degrees of freedom
Residual deviance: 110.06  on 98  degrees of freedom
AIC: 114.1

Number of Fisher Scoring iterations: 4

Los p-valores son los mismos, por lo que la alimentación debe ser la misma. No puedo recordar las fórmulas para las dos versiones diferentes del tamaño del efecto. El tamaño del efecto de las medidas son un poco raro, porque en los viejos tiempos, usted quería reducir el número de tablas que se ponen en los libros (así tenemos, por ejemplo, $f^2$ en lugar de $R^2$, cuando hay una relación directa entre ellos, y $R^2$ es lo que todo el mundo entiende).

-3voto

jlo Puntos 755

Esto es predecible. El modelo logístico está haciendo más fuerte suposiciones acerca de la naturaleza de las relaciones (y, en consecuencia, de las formas de dependencia). Esto sale en poder superior.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X