Una pregunta similar (preguntando más o menos lo contrario, qué pasa si los intervalos se superponen) ocurrió aquí ¿Por qué la media ± 2*SEM (intervalo de confianza del 95%) se solapa, pero el valor p es 0,05?
Hacer comparaciones sobre los errores estándar o los intervalos de confianza es una regla general que utiliza
$$z_{overlap} = \frac{\vert \bar{X}_1- \bar{X}_2 \vert}{SE_1+SE_2} \geq 2$$
mientras que el valor t es más preciso
$$t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{SE_1^2+SE_2^2}}$$
Normalmente se obtiene $z_{overlap}<t$ y subestima la distancia y sobreestima el valor p. Por lo tanto, incluso cuando los intervalos sólo se solapan, la diferencia "correcta" (la $t$ ) podría ser mayor y el valor p menor que el 5%. Y si los intervalos no se solapan, el valor p será aún menor.
Si los intervalos de confianza no se superponen, el $t$ será incluso mayor que 2, y el valor p debería ser inferior al 5%.
Excepciones En la respuesta a esta pregunta se mencionan dos excepciones
-
En el caso de la varianza agrupada, puede darse la situación -aunque es poco frecuente- de que la varianza de la muestra mayor sea mayor que la varianza de la muestra menor, y entonces es posible que $t<z_{overlap}$ .
-
En lugar de valores z y una prueba z, en realidad estás haciendo ( debería hacer ) una prueba t. Así que puede ser que los niveles en los que se basan los intervalos de confianza para las barras de error (como "el 95% equivale a 2 veces el error estándar") sean diferentes para la prueba t. Para ser justos, para comparar manzanas con manzanas, deberías utilizar el mismo estándar y basar los niveles de confianza para las barras de error también en una prueba t. Así que supongamos que también para la prueba t el nivel de límite que se relaciona con el 95% es igual o inferior a 2 (este es el caso para tamaños de muestra superiores a 60).
Estas son las excepciones, cuando no podemos concluir con certeza que el valor p es inferior al 5% cuando los intervalos de confianza del 95% no se superponen.