18 votos

Explicación para no entero de grados de libertad en t prueba con varianzas desiguales

El procedimiento de la prueba de t SPSS reporta 2 análisis al comparar 2 independiente significa, un análisis de varianzas iguales asumidas y con varianzas iguales no asumidas. Los grados de libertad (df) cuando se asumen varianzas iguales son siempre valores enteros (y n-2 igual). El df cuando no se asumen varianzas iguales son no enteros (por ejemplo, 11.467) y en ninguna parte cerca n-2. Estoy buscando una explicación de la lógica y el método utilizado para calcular estas df de no entero.

13voto

AdamSane Puntos 1825

Pensé que debía ampliar mis comentarios en @gung la respuesta, explique la importancia de la relación I mencionado en los comentarios y mostrar algunos de los valores interesantes.

El de Welch-Satterthwaite d.f. son

$$\nu_{_W} = \frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\frac{s_1^4}{n_1^2\nu_1}+\frac{s_2^4}{n_2^2\nu_2}}$$

Tenga en cuenta que $s_i^2/n_i$ es la estimación de la varianza de la $i^\text{th}$ la media de la muestra. Vamos $r_i=s_i^2/n_i$, $i=1,2$ y $r=r_1/r_2$, por lo que

\begin{align} \nu_{_W} &= \frac{\left(r_1+r_2\right)^2}{\frac{r_1^2}{\nu_1}+\frac{r_2^2}{\nu_2}} \newline \newline &=\frac{\left(r_1+r_2\right)^2}{r_1^2+r_2^2}\frac{r_1^2+r_2^2}{\frac{r_1^2}{\nu_1}+\frac{r_2^2}{\nu_2}} \newline \newline &=\frac{\left(r+1\right)^2}{r^2+1}\frac{r_1^2+r_2^2}{\frac{r_1^2}{\nu_1}+\frac{r_2^2}{\nu_2}} \end{align}

El primer término es $1+\text{sech}(\log(r))$, que aumenta a partir de la $1$ $r=0$ $2$ $r=1$y luego disminuye a$1$$r=\infty$; es simétrica en $\log r$.

El segundo término es un ponderado de la media armónica:

$$H(\underline{x})=\frac{\sum_{i=1}^n w_i }{ \sum_{i=1}^n \frac{w_i}{x_i}}\,.$$

de la d.f., donde $w_i=r_i^2$ son los pesos relativos a los dos d.f.

Es decir, cuando se $r_1/r_2$ es muy grande, converge a $\nu_1$. Al $r_1/r_2$ está muy cerca de a $0$ converge a $\nu_2$. Al $r_1=r_2$ usted obtiene el doble de la media armónica de la d.f., y al $s_1^2=s_2^2$ consigue la costumbre de igualdad de la varianza en la prueba de t de d.f., que también es el máximo valor posible para $\nu_{_W}$.

--

Con una igualdad de la varianza de la prueba t, si los supuestos de suspensión, el cuadrado del denominador es un número constante de veces un chi-cuadrado al azar de la variable aleatoria.

El cuadrado del denominador de la Welch t-test no es (un número constante de veces) chi-cuadrado; sin embargo, a menudo no demasiado mal una aproximación. Una discusión pertinente se puede encontrar aquí

11voto

Sean Hanley Puntos 2428

Lo que usted se refiere es el de Welch-Satterthwaite la corrección de los grados de libertad. El $t$-prueba cuando el WS se aplica la corrección es a menudo llamado Welch $t$-prueba. (Por cierto, esto no tiene nada que ver con el programa SPSS, todos los estadísticos de software será capaz de llevar a cabo Welch $t$-prueba, solo que no se suele informar tanto de lado a lado por defecto, así que no tendría que ser necesariamente le pide a pensar sobre el tema.) La ecuación para la corrección es muy feo, pero puede ser visto en la página de la Wikipedia; a menos que esté muy de aptitud matemática o un masoquista, no recomiendo tratando de trabajar a través de él para entender la idea. De un flojo punto de vista conceptual, sin embargo, la idea es relativamente sencilla: el regular $t$-prueba asume que las varianzas son iguales en los dos grupos. Si no lo son, entonces la prueba no debe beneficiarse de esa suposición. Puesto que el poder de la $t$-prueba puede ser visto como una función de la residual grados de libertad, una manera de ajustar para esto es 'reducir' el df un poco. La adecuada df debe estar en algún lugar entre la df y el df de los más pequeños del grupo. (Como @Glen_b las notas de abajo, depende de los tamaños relativos de $s^2_1/n_1$ vs $s_2^2/n_2$; si el mayor n se asocia con una suficientemente menor varianza, la combinación de la df puede ser inferior al mayor de los dos, df.) El WS corrección encuentra el derecho proporción de camino desde el primero al último para ajustar el df. Entonces el estadístico de prueba es impuesta en contra de una $t$-distribución con la df.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X