Tengo una prueba t de una muestra (contra el valor 0 de la hipótesis nula) para la que me gustaría calcular el intervalo de confianza de la d de Cohen. Sé cómo obtener el IC del 95% para la media, así que supongo que puedo introducir los límites de este intervalo en esa fórmula para obtener un IC para la d de Cohen. ¿Debo tenerlo en cuenta?
Respuestas
¿Demasiados anuncios?No, como sospechas con razón, este enfoque no tiene en cuenta la incertidumbre en la DE estimada (y el uso de la distribución t no es suficiente para hacerlo). Para construir un IC que sí lo tenga en cuenta, hay que utilizar la distribución t no central y emplear un procedimiento iterativo. Véase, por ejemplo, Cumming y Finch (2001) o Steiger y Fouladi (1997).
Básicamente, sólo hay que encontrar esos valores del parámetro de no centralidad de una distribución t no central con $n-1$ grados de libertad que cortan 0,025 en las colas inferior y superior de la distribución (suponiendo que se desea un IC del 95%). Aquí hay un ejemplo en R:
### data
x - c(0.7, 1.1, 0.5, 1.9, 1.1, 1.4, 0.5, 0.4, 1.2, 0.8,
-1.2, -1.0, 0.2, 0.4, -0.6, 0.4, -0.4, 0.7, -1.0, 2.4)
### does not take uncertainty in sd(x) into consideration
t.test(x)$conf.int / sd(x)
Esto produce:
[1] 0.03010098 0.96612980
Y este es el enfoque correcto:
tval <- t.test(x)$statistic
n <- length(x)
pt(tval, df=n-1, ncp=0.0266992 * sqrt(n), lower.tail=FALSE)
pt(tval, df=n-1, ncp=0.9579698 * sqrt(n), lower.tail=TRUE)
Así que, 0.0266992
y 0.9579698
son los límites de la IC. Encontré esos valores por ensayo y error (a partir de los valores obtenidos anteriormente), pero por supuesto se podría escribir una función que automatice esto.
Cumming, G., y Finch, S. (2001). Un manual sobre la comprensión, el uso y el cálculo de los intervalos de confianza basados en distribuciones centrales y no centrales. Medición educativa y psicológica, 61 (4), 532-574.
Steiger, J. H., y Fouladi, R. T. (1997). Noncentrality interval estimation and the evaluation of statistical models. En L. L. Harlow, S. A. Mulaik, & J. H. Steiger (Eds.), ¿Y si no hubiera pruebas de significación? (pp. 221-257). Mahwah, Nueva Jersey: Erlbaum.
Por eso hay dos fórmulas para la varianza y la desviación típica. En la descripción de una muestra, la desviación típica es $s =\sqrt{ \frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}$ mientras que, si se estima la verdadera desviación estándar de la muestra, la $\frac{1}{N}$ cambios en $\frac{1}{N-1}$ . Por lo tanto, hay una "corrección" en cierto modo, ya que la desviación estándar estimada y, por lo tanto, el IC del 95% es mayor, si la muestra es más pequeña. Para más información, busque "corrección de Bessel".