15 votos

Grados de libertad de la prueba t de Welch

La prueba t de Welch para varianzas desiguales (también conocida como Welch-Satterthwaite o Welch-Aspin) suele tener un grados de libertad no enteros . ¿Cómo deben citarse estos grados de libertad al comunicar los resultados de la prueba?

"Según diversas fuentes*, es habitual redondear a la baja hasta el número entero más próximo antes de consultar las tablas t estándar, lo cual tiene sentido, ya que esta forma de redondear es conservadora.** Algunos programas estadísticos más antiguos también lo hacen (por ejemplo. Graphpad Prism antes de la versión 6 ) y algunas calculadoras en línea siguen haciéndolo. Si se hubiera utilizado este procedimiento, la notificación del redondeado grados de libertad parece apropiado. (Aunque utilizar un software mejor podría ser aún más apropiado).

Pero la gran mayoría de los paquetes modernos utilizan la parte fraccionaria, por lo que en este caso parece que debe citarse la parte fraccionaria. No veo que sea apropiado citar con más de dos decimales, ya que una milésima de grado de libertad sólo tendría un impacto insignificante en el p -valor.

Buscando en Google scholar, puedo ver artículos que citan el df como un número entero, con un decimal o con dos decimales. ¿Existen directrices sobre el grado de precisión que se debe utilizar? Además, si el programa informático utiliza la parte fraccionaria completa, ¿debería redondearse la df citada? abajo hasta el número de cifras deseado (por ejemplo $7.5845... \rightarrow 7.5$ a 1 d.p. o $\rightarrow 7$ como número entero) como correspondía con el cálculo conservador, o como me parece más sensato, redondeado convencionalmente ( al ) de modo que $7.5845... \rightarrow 7.6$ a 1 d.p. o $\rightarrow 8$ al entero más próximo?

Edita: Aparte de conocer la forma teóricamente más sólida de informar sobre df no enteros, también sería bueno saber lo que la gente hace en la práctica . Es de suponer que las revistas y guías de estilo tienen sus propios requisitos. Me gustaría saber qué exigen las guías de estilo más influyentes, como la APA. Por lo que he podido averiguar (su manual no está disponible gratuitamente en Internet), la APA tiene una preferencia general por que casi todo aparezca con dos decimales, excepto p -valores (que pueden ser dos o tres p.d.) y porcentajes (redondeados al porcentaje más próximo) - que cubren las pendientes de regresión, t estadísticas, F estadísticas, $\chi^2$ estadísticas, etc. Esto es bastante ilógico, teniendo en cuenta que el segundo decimal ocupa una cifra significativa muy diferente, y sugiere una precisión bastante diferente, en 2,47 que en 982,47, pero podría explicar el número de Welch df con dos decimales que vi en mi muestra no científica.

$*$ Por ejemplo, Ruxton, G.D. La prueba t de varianza desigual es una alternativa infrautilizada a la prueba t de Student y a la prueba U de Mann-Whitney , Behavioral Ecology (julio/agosto de 2006) 17 (4): 688-690 doi:10.1093/beheco/ark016

$**$ Aunque la propia aproximación Welch-Satterthwaite puede o no ser conservadora, y en un caso en el que no lo sea, redondear a la baja los grados de libertad no es garantía de compensación global.

1 votos

No he estudiado la práctica real -por eso esto es un comentario y no una respuesta- pero esperaría que se basara en el juicio relacionado con la notificación de cifras significativas. Para una df relativamente alta, a menudo un cambio en el primer decimal no cambiaría en absoluto el valor p (al nivel de precisión indicado), por lo que redondear a un número entero está bien. Para df muy bajos $\nu$ y valores extremos de $t$ la derivada $|\frac{\partial}{\partial\nu}F_\nu(t)|$ puede superar $0.01$ sugiriendo en estos casos que $\nu$ debe comunicarse con una cifra menos significativa que $p$ sí mismo.

0 votos

@whuber Efectivamente, es una observación útil, sobre todo si la comparamos con la respuesta de Glen_b. ¿Qué tan bajo es "muy bajo" para $\nu$ ? (Mi sospecha, a partir de la muestra de artículos que he encontrado, es que mucha "práctica real" puede no ser lo mismo que "buena práctica"). Sospecho que el seguimiento robotizado de las directrices tiene tanto efecto como el juicio, por lo que sería interesante saber cuáles son las directrices habituales para informar).

10voto

jldugger Puntos 7490

No he estudiado la práctica real, por lo que esta respuesta no puede abordar ese aspecto de la cuestión. Como principio general, yo esperaría que el tratamiento de las cifras significativas en la notificación de los grados de libertad (df) se basara en un juicio relacionado con las cifras significativas.

El principio es ser coherente Utilizar la precisión en una cantidad que sea adecuada para la precisión utilizada en otra que esté relacionada con ella. En concreto, al comunicar valores $x$ y $y=f(x)$ cuando $x$ se da al múltiplo más cercano de un valor pequeño $h$ (como $h=\frac{1}{2}\times 10^{-6}$ para seis posiciones después del punto decimal), la precisión relativa en $y$ a través de la función $f$ es

$$\sup_{-h \le k \le h} |f(x+k) - f(x)| \approx h | \frac{d}{dx} f(x) |.$$

La aproximación se aplica cuando $f$ es continuamente diferenciable en el intervalo $[x-h, x+h]$ .

En la presente solicitud, $y$ es el $p$ -valor, $x$ son los grados de libertad $\nu$ y

$$y = f(x) = f(\nu) = F_\nu(t)$$

donde $t$ es el estadístico Welch-Satterthwaite y $F_\nu$ es la FDA de Student $t$ distribución con $\nu$ grados de libertad.

Para df relativamente altos $\nu$ A menudo, un cambio en el primer decimal no cambiaría en absoluto el valor p (al nivel de precisión indicado), por lo que redondear a un número entero está bien ( $h=1/2$ pero $h|\frac{d}{dx}f(x)|$ es muy pequeño). Para df muy bajos y valores extremos del estadístico $t$ la magnitud de la derivada $|\frac{\partial}{\partial\nu}F_\nu(t)|$ puede superar $0.01$ sugiriendo en estos casos que $\nu$ debe indicarse con un decimal menos que $p$ sí mismo.

Compruébelo usted mismo con este gráfico de contorno etiquetado de la magnitud de la derivada para el df más bajo (razonable) y rangos de $|t|$ que serían de interés (porque pueden dar lugar a valores p bajos).

Figure

Las etiquetas muestran el logaritmo en base 10 de la derivada. Así, en los puntos comprendidos entre $-k$ y $-(k+1)$ en este gráfico, cambiando la df indicada en el campo $j^\text{th}$ lugar después del punto decimal probablemente cambiará el valor p notificado sólo en el $(j+k)^\text{th}$ y lugares posteriores. Por ejemplo, supongamos que redondea el valor p a $10^{-6}$ (seis decimales). Considere las estadísticas $\nu=2.5$ y $t=8$ . Se encuentran cerca del $-3$ contorno logarítmico. Por lo tanto, $\nu$ deben comunicarse a $6+(-3)=3$ decimales.

Las zonas de color azul claro, para los mayores $k$ son las que preocupan, porque muestran dónde se producen pequeños cambios en $\nu$ tienen los mayores efectos sobre el valor p.

Contrasta esto con la situación para df más altos (de $4$ a $30$ ):

Figure 2

La influencia de $\nu$ sobre la precisión de $p$ disminuye rápidamente a medida que $\nu$ aumenta.

1 votos

Esta ha sido una contribución muy útil para establecer según qué principios se deben redondear los grados de libertad (¡+50!); espero que algún otro que responda más tarde pueda rellenar las lagunas sobre la práctica real.

8voto

AdamSane Puntos 1825

Es habitual redondear al número entero más próximo antes de consultar las tablas t estándar

La razón por la que era una convención es porque las tablas no tienen df no enteros. No hay razón para hacerlo de otra manera.

lo que tiene sentido ya que este ajuste es conservador.

Bueno, en realidad la estadística no tiene una distribución t, porque el denominador al cuadrado no tiene una distribución chi-cuadrado a escala. Es una aproximación que puede o no ser conservadora en algún caso particular -- redondear df hacia abajo puede no estar seguro de ser conservador cuando consideramos la distribución exacta de la estadística en un caso particular.

(¿por interpolación o haciendo números para la distribución t con esa df?)

Los valores p de las distribuciones t (aplicando la cdf a un estadístico t) pueden calcularse mediante una variedad de aproximaciones bastante precisas, por lo que efectivamente se calculan en lugar de interpolarse.

No veo que sea apropiado citar con más de dos decimales

Estoy de acuerdo.

¿Existen directrices sobre la precisión que se debe utilizar?

Una posibilidad podría ser investigar cómo de precisa es la aproximación Welch-Satterthwaite para el valor p en esa región general de proporciones de varianza y no citar una precisión relativa sustancialmente mayor de la que sugeriría que había en la f.d. (teniendo en cuenta que la f.d. en el chi-cuadrado en el cuadrado del denominador sólo están dando una aproximación a algo que no es chi-cuadrado de todos modos).

1 votos

Debería haber aclarado que "redondear a la baja es conservador". La propia aproximación de Welch-Satterthwaite puede ser conservadora o no. Pero el proceso de redondeo hacia abajo sí lo es: si la aproximación no era conservadora al principio, al menos es menos mala después de redondear hacia abajo. En cambio, el redondeo al alza (por ejemplo, "7,5845 redondea lo más cercano a 8") es definitivamente no un ajuste conservador. No me vendría mal expresarlo mejor, pero espero que haya quedado claro.

0 votos

"Una posibilidad podría ser investigar la precisión de la aproximación de Welch-Satterthwaite para el valor p en esa región general de proporciones de varianza" - esto es muy sensato y parece ser el enfoque de principio. ¿Es algo habitual? Estaría bien disponer de algunas pistas para su aplicación. En la práctica, sospecho que las normas de estilo de las revistas suelen tener la última palabra. Pero no sé lo que dicen: en los artículos que encontré en mi búsqueda había una gran variedad de prácticas.

0 votos

Para evitar confusiones a futuros lectores, he intentado aclarar el redondeo conservador en el cuerpo de la pregunta. Gracias por aclararlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X