7 votos

¿Cómo interpretar el intervalo de confianza de una prueba F de varianza utilizando R?

Estoy tratando de entender el intervalo de confianza devuelto por la función var.test() en R. Más concretamente, el intervalo de confianza devuelto por var.test() no es el que encuentro al hacer el cálculo de la prueba F por mí mismo. Por ejemplo:

> s1 <- 10:12 ; s2 <- 13:16
> var(s1)
[1] 1
> var(s2)
[1] 1.666667
> var.test(s1,s2)

    F test to compare two variances

data:  s1 and s2 
F = 0.6, num df = 2, denom df = 3, p-value = 0.7926
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
  0.03739691 23.49929674 
sample estimates:
ratio of variances 
               0.6

El intervalo de confianza del 95% es aquí [0,037,23,499]. Interpreto "intervalo de confianza" como "región de rechazo", es decir, si el estadístico de prueba F está dentro de este intervalo, la hipótesis nula debería aceptarse, para un nivel estadístico determinado (aquí el 95%). Sin embargo, cuando intento calcular esto, encuentro :

> qf(c(0.025,0.975),length(s1)-1,length(s2)-1)
[1]  0.02553268 16.04410643

Así que supongo que me equivoco al interpretar el "intervalo de confianza" de var.test() como la "región de rechazo".

Así que mi pregunta es : ¿qué representa este intervalo de confianza?

6voto

Eero Puntos 1612

Su método utilizando qf calcula la región de rechazo con la que se compararía la relación de las 2 varianzas. Usar la F central es lo correcto porque calculamos la región de rechazo asumiendo que la hipótesis nula es verdadera y si la nula (que las varianzas son iguales) es verdadera entonces tenemos una distribución F central.

La derivación de la fórmula para el intervalo de confianza es la siguiente (sólo muestro el límite inferior, algunas ligeras modificaciones dan el límite superior)

$ \frac{v1}{\sigma_1^2} / \frac{v2}{\sigma_2^2} \sim f(df_1,df_2) $

$ \frac{v1}{v2} \times \frac{\sigma_1^2}{\sigma_2^2} \sim f(df_1,df_2)$

$prob( \frac{v1}{v2} \times \frac{\sigma_2^2}{\sigma_1^2} > f_{0.975} ) = 0.025 $

$prob( \frac{\sigma_1^2}{\sigma_2^2} < \frac{v1}{v2}/f_{0.975} )= 0.025$

Así que el intervalo de confianza también se basa en la F central, ya que está estimando la relación de las 2 varianzas verdaderas.

Y en R para obtener el valor "manualmente" se hace

vr <- var(s1)/var(s2)
vr/qf(.975,2,3)

que coincide con el resultado de var.test()

5voto

mat_geek Puntos 1367

La región de rechazo de una prueba y un intervalo de confianza son cosas diferentes. La región de rechazo es la región en la que se rechaza la hipótesis nula de que el cociente de varianzas es igual a $1$ . A $100(1-α)\%$ El intervalo de confianza es un intervalo que tiene la propiedad de que en un muestreo repetido incluiría el verdadero valor del parámetro en $100(1-α)\%$ de los casos. Existe una correspondencia 1-1 entre un intervalo de confianza y la prueba de hipótesis correspondiente, pero eso no significa que la región de rechazo sea igual a la región de confianza, incluso cuando el nivel de confianza es el mismo que el nivel de significación de la prueba.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X