7 votos

El valor exacto de los grados de libertad de la prueba t de Welch

Wikipedia define una ecuación para aproximar los grados de libertad en la prueba t de Welch y no menciona nada sobre el valor exacto. ¿Hay alguna razón por la cual no podríamos evaluar el gl exacto y tenemos que usar la aproximación? Además, dice que:

Los grados de libertad aproximados se redondean hacia abajo al entero más cercano [cita requerida]

También se agradecería una explicación de por qué deberíamos redondear hacia abajo.

2 votos

Como nota al margen, todas las soluciones frecuentistas a este problema son aproximadas. En su lugar, puedes utilizar una solución Bayesiana exacta como en el procedimiento BEST de John Kruschke que está implementado en R.

0 votos

Se puede encontrar una discusión relevante aquí - stats.stackexchange.com/questions/124961/…

5voto

Aaron Puntos 36

Respuesta corta: No hay grados de libertad exactos porque el estimador de la varianza en esta prueba no sigue una distribución chi-cuadrado exacta.


Respuesta más larga: El test T de Welch da una solución aproximada al problema de Behrens-Fisher (comparando las medias de dos muestras con diferentes varianzas). Utiliza la estadística de prueba estandarizada:

$$T = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{S_1^2/N_1 + S_2^2/N_2}}.$$

El denominador en esta estadística de prueba es la raíz cuadrada de un estimador de la diferencia de medias:

$$\hat{\mathbb{V}}(\bar{X}_1-\bar{X}_2) = \frac{S_1^2}{N_1} + \frac{S_2^2}{N_2} \sim \frac{\chi_{N_1-1}^2}{N_1} \cdot \sigma_1^2 + \frac{\chi_{N_2-1}^2}{N_2} \cdot \sigma_2^2.$$

Esta cantidad es una suma ponderada de variables aleatorias chi-cuadrado independientes. Su distribución exacta es bastante complicada (y se representa mejor a través de su función generadora de momentos), pero no es una distribución exacta chi-cuadrado.

La prueba utiliza la aproximación de Welch-Satterthwaite, que aproxima la distribución de esta cantidad por una sola distribución chi-cuadrado escalada. En esta aproximación, la fórmula de los grados de libertad surge como la mejor aproximación de la distribución chi-cuadrado a la verdadera distribución de esta cantidad. Sin esta aproximación a la distribución chi-cuadrado no hay un solo grado de libertad exacto. En cambio, la distribución exacta es una suma ponderada de variables aleatorias chi-cuadrado con las ponderaciones y grados de libertad mencionados anteriormente.

2voto

Ben Bolker Puntos 8729

La respuesta de @Ben es muy clara acerca de por qué no es posible una solución exacta para los grados de libertad.

En cuanto a

Los grados de libertad aproximados se redondean hacia abajo al entero más cercano [cita necesaria]

Esto parece inusual. Existe una sección en la página de discusión del artículo que cuestiona si esto es habitual o no, y por qué se redondearían hacia abajo en lugar de hacia arriba.

Esta pregunta de CV discute la manera de reportar grados de libertad no enteros con mucho más detalle, y proporciona algunas fuentes que dicen que es "convencional" (principalmente de los días en que los cálculos se hacían a mano y los valores críticos de la distribución $t$ se buscaban en tablas de referencia que daban valores solo para df enteros).

0 votos

Estoy de acuerdo con esto (+1). Con la computación moderna no hay razón para redondear el DF de la aproximación de Welch-Satterwaite. Es mejor utilizar el valor aproximado sin redondear.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X