1 votos

¿Calcular el intervalo de confianza para la d de Cohen?

Cuando tengo el error estándar de d (diferencia media estándar), ¿cómo debo calcular el intervalo de confianza del mismo? Si conoces un tutorial por favor preséntalo.

0 votos

Este documento discute los tamaños del efecto y sus IC. La parte sobre dos muestras es directamente aplicable a su pregunta.

0voto

BruceET Puntos 7117

Antecedentes. Suponga que tiene dos muestras aleatorias independientes, digamos X1,,XnX1,,Xn de Norm(μx,σx) y Y1,,Ym de Norm(μy,σy). Si se hace la prueba H0:μx=μy contra Ha:μxμy, debe utilizar una prueba t de varianzas separadas de Welch. Si está bastante seguro de que σx=σy, podría utilizar la prueba t de dos muestras agrupadas. Recientemente, se ha desaconsejado el uso de la prueba combinada, excepto cuando cuando el tamaño de la muestra es muy pequeño o cuando hay pruebas o experiencia o experiencia que σx=σy.

Tamaño del efecto. La d de Cohen (antes g de Hedge) pretende medir el "tamaño del efecto en el ámbito de la agrupación. El tamaño del efecto se define como θ=μxμyσ, donde σ=σx=σy.

Comúnmente, μx se estima mediante ˉX, μy se estima mediante ˉY, y σ se estima mediante Sp==(m1)S2x+(n1)S2ym+n2, donde Sx y Sy son las desviaciones estándar de las dos muestras (tomadas individualmente). A continuación, θ se estima mediante la d de Cohen: d=ˉXˉYSp.

Es lo mismo que la estadística t agrupada de Student, pero el contexto en el que se utiliza es algo diferente: Si H0 es verdadera, entonces T=(ˉXˉY)/Sp tiene la distribución t de Student con grados de libertad ν=m+n2. Sin embargo, el tamaño del efecto es principalmente de interés cuando H0 es falso. Si H0 se rechaza, un enfoque tradicional ha sido hacer un intervalo de confianza (IC) para δ=μxμy y la fórmula para ese IC se puede encontrar en la mayoría de los textos de estadística elemental.

IC para el tamaño del efecto. Quiere encontrar un IC para θ. Desgraciadamente, cuando H0 no es cierto, la distribución de d tiene una distribución t no central. El artículo que he enlazado en mi comentario explica cómo utilizar el software estadístico R para obtener un IC para θ basado en d, utilizando los comandos de una de las bibliotecas de R. Un programa para un CI bootstrap paramétrico para θ se ilustra a continuación.

Ejemplo. Consideremos los datos falsos, con una muestra aleatoria de n=10 valores XiNorm(115,10) y una muestra aleatoria independiente de m=20 valores YiNorm(100,10). Así, H0 es falso, δ=15 y θ=15/10=1.5. A continuación mostramos cómo se generan los datos generados, y hacemos una prueba t agrupada de H0 contra. H0. Sucede que H0 se rechaza y que un IC del 95% para δ es (2.18,17.38). La IC contiene ˉXˉY (como debe ser); también resulta que contiene δ=15. También, Sp=9.58, que no está lejos de σ=10, teniendo en cuenta el pequeño tamaño de la muestra.

set.seed(318);  n = 10;  m = 20
mu.x = 115;  mu.y = 100;  sg = 10
x = rnorm(n, mu.x, sg);  y = rnorm(m, mu.y, sg)
t.test(x, y, var.eq=T)

        Two Sample t-test

data:  x and y 
t = 2.6352, df = 28, p-value = 0.01355
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
  2.177199 17.377599 
sample estimates:
mean of x mean of y 
 110.4174  100.6400 
s.p = sqrt((9*var(x) + 19*var(y))/ 28);  s.p
## 9.579947

Los datos se representan a continuación:

enter image description here

Para conseguir un CI para θ, podemos utilizar un procedimiento bootstrap. Si conociéramos la verdadera distribución de la d de Cohen en esta situación, podríamos utilizarla para obtener límites L y U tal que P(L<d<U)=1.96, por lo que un IC del 95% para θ sería (L,U).

Al no conocer esta distribución, utilizamos utilizamos los datos disponibles ˉX,ˉY, y Sp como estimaciones de μx,μy, y σ, respectivamente. A continuación, volvemos a hacer la muestra B=10,000 valores de d=T, y tomamos los cuantiles 0,025 y 0,975 de la distribución re-muestreada resultante de d, para servir como límites de confianza aproximados. El IC del 95% resultante para θ es (0.634,5.013), que contiene el valor observado de d=T=2.64 (de la prueba t anterior).

Como hemos simulado los datos, sabemos que el verdadero tamaño del efecto es θ=1.5 y resulta que el IC también contiene ese valor. El procedimiento bootstrap implica la simulación como dispositivo computacional. Para los mismos datos, dará resultados ligeramente diferentes en cada ejecución. Utilice la semilla 123 como se muestra para obtener exactamente el mismo resultado; omita el set.seed declaración o cambiar la semilla para una nueva ejecución. Una ejecución adicional dio el CI (0.633,5.012).]

set.seed(123); B = 10^4  
n=10; m=20; a.obs=mean(x); b.obs=mean(y); sg.obs=sqrt( (9*var(x)+19*var(y)) /28 )
a.obs;  b.obs;  sg.obs  #values observed in sample (from above)
## 110.4174
## 100.64
## 9.579947
d.re = replicate(B, t.test(rnorm(n,a.obs,sg.obs),rnorm(m,b.obs,sg.obs), var.eq=T)$stat)
L.re = quantile(d.re, .025); U.re = quantile(d.re, .975)
as.numeric(c(L.re,U.re))
## 0.6337554 5.0126049

La figura siguiente muestra un histograma de los valores bootstrap de la d de Cohen junto con los límites de confianza bootstrap (rojo).

enter image description here

Nota: Como truco para simplificar el código de código R para el procedimiento Bootstrap, utilizamos la función incorporada t.test y utilizar sólo el estadístico de prueba T (obtenido con $stat ) para el valor remuestreado d.re de la d de Cohen.

0 votos

Estimado Bruce, muchas gracias por su respuesta informativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X