13 votos

La varianza de Cohen $d$ estadística

Cohen $d$ es una de las formas más comunes en que se mide el tamaño de un efecto (ver Wikipedia). Simplemente mide la distancia entre dos medios en términos de que el conjunto de la desviación estándar. Cómo podemos obtener la fórmula matemática de la varianza de la estimación de Cohen $d$?

De diciembre de 2015 edición: Relacionados a esta pregunta es la idea de calcular los intervalos de confianza alrededor de $d$. En este artículo se establece que

$$\sigma_{d}^2 = \dfrac{n_{+}}{n_{\times}} + \dfrac{d^2}{2n_{+}} $$

donde $n_{+}$ es la suma de los dos tamaños de muestra y $n_{\times}$ es el producto de los dos tamaños de muestra.

Cómo es esto de la fórmula de la derivada?

20voto

Dan Puntos 51

Tenga en cuenta que la varianza de la expresión en cuestión es una aproximación. Las coberturas (1981) derivado de la gran varianza de la muestra de $d$ y de aproximación en una configuración general (es decir, múltiples experimentos o estudios), y mi respuesta bastante camina a través de las derivaciones en el papel.

En primer lugar, los supuestos que vamos a utilizar son los siguientes:

Supongamos que tenemos dos grupos de tratamiento, $T$ (tratamiento) y $C$ (control). Deje $Y_{Ti}$ $Y_{Cj}$ ser los puntajes/respuestas/lo que sea de tema $i$ en el grupo $T$ y sujeto a $j$ en el grupo $C$, respectivamente.

Asumimos que las respuestas están distribuidos normalmente y los grupos de tratamiento y control comparten la varianza, es decir,

\begin{align*} Y_{Ti} &\sim N(\mu_T, \sigma^2), \quad i = 1, \dots n_T \\ Y_{Cj} &\sim N(\mu_C, \sigma^2), \quad j = 1, \dots n_C \end{align*}

El tamaño del efecto en las que estamos interesados en estimar en cada estudio es $\delta = \frac{\mu_T - \mu_C}{\sigma}$. El estimador del tamaño del efecto vamos a utilizar es \begin{equation*} d = \frac{\bar{Y}_T - \bar{Y}_C}{\sqrt{\frac{(n_T - 1)S_T^2 + (n_C - 1)S_C^2}{n_T + n_C - 2}}} \end{ecuación*} donde $S_k^2$ el imparcial de la varianza de la muestra por grupo $k$.

Vamos a considerar el gran muestra de las propiedades de $d$.

En primer lugar, tenga en cuenta que: \begin{equation*} \bar{Y}_T - \bar{Y}_C \sim N \Bigg( \mu_T - \mu_C, \,\sigma^2\frac{n_T + n_C}{n_T n_C} \Bigg) \end{ecuación*} y (se suelta con mi notación): \begin{equation} \frac{(n_T - 1)S_T^{2}}{\sigma^2(n_T + n_C - 2)} = \frac{1}{n_T + n_C - 2}\frac{(n_T - 1)S_T^{2}}{\sigma^2} \sim \frac{1}{n_T + n_C- 2}\chi_{n_T - 1}^2 \tag{1} \end{equation} y \begin{equation} \frac{(n_C - 1)S_C^{2}}{\sigma^2(n_T + n_C - 2)} = \frac{1}{n_T + n_C - 2}\frac{(n_C - 1)S_C^{2}}{\sigma^2} \sim \frac{1}{n_T + n_C- 2}\chi_{n_C - 1}^2 \tag{2} \end{equation}

Las ecuaciones (1) y (2) llevar a que el hecho de que (de nuevo, se suelta con mi notación): \begin{equation*} \frac{1}{\sigma^2}\frac{(n_T - 1)S_T^{2} + (n_C - 1)S_C^{2}}{n_T + n_C - 2} \sim \frac{1}{n_T + n_C - 2}\chi_{n_T + n_C - 2}^2 \end{ecuación*}

Ahora, algunos astutos álgebra: \begin{align*} d &= \frac{\bar{Y}_T - \bar{Y}_C}{\sqrt{\frac{(n_T - 1)S_T^2 + (n_C - 1)S_C^2}{n_T + n_C - 2}}} \\\\ &= \frac{\left(\sigma\sqrt{\frac{n_T + n_C}{n_T n_C}}\right)^{-1}(\bar{Y}_T - \bar{Y}_C)}{\left(\sigma\sqrt{\frac{n_T + n_C}{n_T n_C}}\right)^{-1}\sqrt{\frac{(n_T - 1)S_T^2 + (n_C - 1)S_C^2}{n_T + n_C - 2}}} \\\\ &= \frac{\frac{(\bar{Y}_T - \bar{Y}_C) - (\mu_T - \mu_C)}{\sigma\sqrt{\frac{n_T + n_C}{n_T n_C}}} + \frac{\mu_T - \mu_C}{\sigma\sqrt{\frac{n_T + n_C}{n_T n_C}}}}{\left(\sqrt{\frac{n_T + n_C}{n_T n_C}}\right)^{-1}\sqrt{\frac{(n_T - 1)S_T^2 + (n_C - 1)S_C^2}{\sigma^2(n_T + n_C - 2)}}} \\\\ &= \sqrt{\frac{n_T + n_C}{n_T n_C}}\left(\frac{\theta + \delta\sqrt{\frac{n_T n_C}{n_T + n_C}}}{\sqrt{\frac{V}{\nu}}}\right) \end{align*} donde $\theta \sim N(0,1)$, $V \sim \chi^2_{\nu}$, y $\nu = n_T+n_C-2$. Por lo tanto, $d$ $\sqrt{\frac{n_T + n_C}{n_T n_C}}$ veces una variable que sigue una no-central de la distribución t con $n_T + n_C - 2$ grados de libertad y parámetro no-centralidad de $\delta\sqrt{\frac{n_T n_C}{n_T + n_C}}$.

Utilizando el momento de las propiedades de la no-central $t$ distribución, se sigue que: \begin{equation*} \mathrm{Var}(d) = \frac{(n_T + n_C - 2)}{(n_T + n_C - 4)}\frac{(n_T + n_C)}{n_T n_C}(1+ \delta^2\frac{n_T n_C}{n_T + n_C}) - \frac{\delta^2}{b^2} \tag{3} \end{ecuación*} donde \begin{equation*} b = \frac{\Gamma\left(\frac{n_T + n_C - 2}{2}\right)}{\sqrt{\frac{n_T+n_C-2}{2}}\Gamma\left(\frac{n_T+n_C-3}{2}\right)} \approx 1 - \frac{3}{4(n_T+n_C+2)-1} \end{ecuación*}

De modo que la Ecuación (3) proporciona la exacta gran varianza de la muestra. Tenga en cuenta que un estimador imparcial para$\delta$$b d$, con variación:

\begin{equation*} \mathrm{Var}(bd) = b^2\frac{(n_T + n_C - 2)}{(n_T + n_C - 4)}\frac{(n_T + n_C)}{n_T n_C}(1+ \delta^2\frac{n_T n_C}{n_T + n_C}) - \delta^2 \end{ecuación*}

Para grandes grados de libertad (es decir, un gran $n_T+n_C-2$), la varianza de un no-central $t$ varia con $\nu$ grados de libertad y parámetro no-centralidad $p$ puede ser aproximada por $1 + \frac{p^2}{2\nu}$ (Johnson, Kotz, Balakrishnan, 1995). Por lo tanto, tenemos: \begin{align*} \mathrm{Var}(d) &\approx \frac{n_T + n_C}{n_T n_C}\left(1 + \frac{\delta^2\left(\frac{n_T n_C}{n_T + n_C}\right)}{2(n_T+n_C-2)}\right) \\\\ &= \frac{n_T + n_C}{n_T n_C} + \frac{\delta^2}{2(n_T+n_C-2)} \end{align*}

Enchufe en nuestro estimador para $\delta$ y hemos terminado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X