La prueba t de Welch para varianzas desiguales (también conocida como Welch-Satterthwaite o Welch-Aspin) suele tener un grados de libertad no enteros . ¿Cómo deben citarse estos grados de libertad al comunicar los resultados de la prueba?
"Según diversas fuentes*, es habitual redondear a la baja hasta el número entero más próximo antes de consultar las tablas t estándar, lo cual tiene sentido, ya que esta forma de redondear es conservadora.** Algunos programas estadísticos más antiguos también lo hacen (por ejemplo. Graphpad Prism antes de la versión 6 ) y algunas calculadoras en línea siguen haciéndolo. Si se hubiera utilizado este procedimiento, la notificación del redondeado grados de libertad parece apropiado. (Aunque utilizar un software mejor podría ser aún más apropiado).
Pero la gran mayoría de los paquetes modernos utilizan la parte fraccionaria, por lo que en este caso parece que debe citarse la parte fraccionaria. No veo que sea apropiado citar con más de dos decimales, ya que una milésima de grado de libertad sólo tendría un impacto insignificante en el p -valor.
Buscando en Google scholar, puedo ver artículos que citan el df como un número entero, con un decimal o con dos decimales. ¿Existen directrices sobre el grado de precisión que se debe utilizar? Además, si el programa informático utiliza la parte fraccionaria completa, ¿debería redondearse la df citada? abajo hasta el número de cifras deseado (por ejemplo $7.5845... \rightarrow 7.5$ a 1 d.p. o $\rightarrow 7$ como número entero) como correspondía con el cálculo conservador, o como me parece más sensato, redondeado convencionalmente ( al ) de modo que $7.5845... \rightarrow 7.6$ a 1 d.p. o $\rightarrow 8$ al entero más próximo?
Edita: Aparte de conocer la forma teóricamente más sólida de informar sobre df no enteros, también sería bueno saber lo que la gente hace en la práctica . Es de suponer que las revistas y guías de estilo tienen sus propios requisitos. Me gustaría saber qué exigen las guías de estilo más influyentes, como la APA. Por lo que he podido averiguar (su manual no está disponible gratuitamente en Internet), la APA tiene una preferencia general por que casi todo aparezca con dos decimales, excepto p -valores (que pueden ser dos o tres p.d.) y porcentajes (redondeados al porcentaje más próximo) - que cubren las pendientes de regresión, t estadísticas, F estadísticas, $\chi^2$ estadísticas, etc. Esto es bastante ilógico, teniendo en cuenta que el segundo decimal ocupa una cifra significativa muy diferente, y sugiere una precisión bastante diferente, en 2,47 que en 982,47, pero podría explicar el número de Welch df con dos decimales que vi en mi muestra no científica.
$*$ Por ejemplo, Ruxton, G.D. La prueba t de varianza desigual es una alternativa infrautilizada a la prueba t de Student y a la prueba U de Mann-Whitney , Behavioral Ecology (julio/agosto de 2006) 17 (4): 688-690 doi:10.1093/beheco/ark016
$**$ Aunque la propia aproximación Welch-Satterthwaite puede o no ser conservadora, y en un caso en el que no lo sea, redondear a la baja los grados de libertad no es garantía de compensación global.
1 votos
No he estudiado la práctica real -por eso esto es un comentario y no una respuesta- pero esperaría que se basara en el juicio relacionado con la notificación de cifras significativas. Para una df relativamente alta, a menudo un cambio en el primer decimal no cambiaría en absoluto el valor p (al nivel de precisión indicado), por lo que redondear a un número entero está bien. Para df muy bajos $\nu$ y valores extremos de $t$ la derivada $|\frac{\partial}{\partial\nu}F_\nu(t)|$ puede superar $0.01$ sugiriendo en estos casos que $\nu$ debe comunicarse con una cifra menos significativa que $p$ sí mismo.
0 votos
@whuber Efectivamente, es una observación útil, sobre todo si la comparamos con la respuesta de Glen_b. ¿Qué tan bajo es "muy bajo" para $\nu$ ? (Mi sospecha, a partir de la muestra de artículos que he encontrado, es que mucha "práctica real" puede no ser lo mismo que "buena práctica"). Sospecho que el seguimiento robotizado de las directrices tiene tanto efecto como el juicio, por lo que sería interesante saber cuáles son las directrices habituales para informar).