12 votos

¿Qué hacer si los grados de libertad sobrepasan el final de las tablas?

Los grados de libertad de mi tabla F no suben lo suficiente para mi gran muestra.

Por ejemplo, si tengo una F con 5 y 6744 grados de libertad, ¿cómo encuentro el valor crítico del 5% para un ANOVA?

¿Y si hiciera una prueba de chi-cuadrado con grandes grados de libertad?

Una pregunta como esta fue publicada hace un tiempo, pero el OP cometió un error y en realidad tenía un d.f. más pequeño, reduciéndolo a un duplicado - pero la pregunta original de d.f. grande debe tener una respuesta en algún lugar del sitio].

1 votos

¿Conseguir una mesa más grande?

18voto

AdamSane Puntos 1825

Tablas F :

  1. La forma más fácil de todas, si se puede, es utilizar un paquete estadístico u otro programa para obtener el valor crítico. Así, por ejemplo, en R, podemos hacer esto:

     qf(.95,5,6744)
    [1] 2.215425

    (pero puede calcular con la misma facilidad un valor p exacto para su F).

  2. Normalmente las tablas F vienen con un "infinito" de grados de libertad al final de la tabla, pero algunas no lo hacen. Si tiene un f.d. realmente grande (por ejemplo, 6744 es realmente grande), puede utilizar el infinito ( $\infty$ ) en su lugar.

    Por lo tanto, podría tener tablas para $\nu_1=5$ que dan 120 df y $\infty$ df:

          ...    5      ...
    
    120        2.2899   
              2.2141

    El $\infty$ La fila de la F.D. funcionará para cualquier $\nu_2$ (denominador d.f.). Si usamos eso tenemos 2,2141 en lugar del exacto 2,2154 pero no está tan mal.

  3. Si no tiene una entrada de infinitos grados de libertad, puede calcular uno a partir de una tabla de chi-cuadrado, utilizando el valor crítico de los f.d. del numerador dividido por esos f.d.

    Así, por ejemplo, para un $F_{5,\infty}$ valor crítico, tome un $\chi^2_5$ valor crítico y dividir por $5$ . El valor crítico del 5% para un $\chi^2_5$ es $11.0705$ . Si dividimos por $5$ eso es $2.2141$ que es el $\infty$ fila de la tabla anterior.

  4. Si sus grados de libertad son demasiado pequeños para usar la entrada "infinito" (pero aún así son mucho más grandes que 120 o lo que sea que su tabla alcance) puede usar interpolación inversa entre la f.d. finita más alta y la entrada en el infinito. Digamos que queremos calcular un valor crítico para $F_{5, 674}$ d.f.

       F       df     120/df    
     ------   ----    -------
     2.2899    120      1     
       C       674    0.17804
     2.2141            0    

    A continuación, calculamos el valor crítico desconocido, $C$ como

    $C \approx 2.2141 + (2.2899-2.2141) \times (0.17804-0)/(1-0) \approx 2.2276$

    (El valor exacto es $2.2274$ Así que eso funciona bastante bien).

    En ese post enlazado se dan más detalles sobre la interpolación y la interpolación inversa.


Tablas de chi-cuadrado :

Si sus f.d. de chi-cuadrado son realmente grandes, puede utilizar tablas normales para obtener una aproximación.

Para grandes f.d. $\nu$ la distribución chi-cuadrado es aproximadamente normal con media $\nu$ y la varianza $2\nu$ . Para obtener el valor superior del 5%, tome el valor crítico del 5% de una cola para una normal estándar ( $1.645$ ) y multiplicar por $\sqrt{2\nu}$ y añadir $\nu$ .

Por ejemplo, imaginemos que necesitamos un valor crítico del 5% superior para un $\chi^2_{6744}$ .

Calculamos $1.645 \times \sqrt{2 \times 6744} + 6744 \approx 6935$ . La respuesta exacta (a $5$ cifras significativas) es $6936.2$ .

Si los grados de libertad son menores, podemos utilizar el hecho de que si $X$ es $\chi^2_\nu$ entonces $\sqrt{2X}\dot\sim N(\sqrt{2\nu-1},1)$ .

Así, por ejemplo, si tuviéramos $674$ d.f. podríamos utilizar esta aproximación. El valor crítico exacto del 5% superior para un chi-cuadrado con 674 f.d. es (a 5 cifras) $735.51$ . Con esta aproximación, calcularíamos como sigue:

Tome el valor crítico superior (de una cola) del 5% para una normal estándar (1,645), añada $\sqrt{2\nu-1}$ elevar al cuadrado el total y dividir por 2. En este caso:

$(1.645+\sqrt{2\times 674-1})^2/2 \approx 735.2$ .

Como vemos, esto está bastante cerca.

Para grados de libertad considerablemente más pequeños, se podría utilizar la transformación de Wilson-Hilferty, que funciona bien hasta unos pocos grados de libertad, pero las tablas deberían cubrirlo. Esta aproximación es que $(\frac{X}{\nu})^{\frac13}\dot\sim N(1-\frac{2}{9\nu},\frac{2}{9\nu})$ .

2 votos

+1 El $\chi^2$ idea puede ser mejorada. Utilice el hecho de que $F$ limita a una función racional de a $\chi^2$ a medida que su segundo parámetro crece. En R por ejemplo, se calcularía como df2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2)) . Obtendrá $2.2177$ con una precisión de tres cifras significativas. Tenga en cuenta que el $\chi^2$ es un parámetro pequeño número entero, indicando que probablemente estará en la tabla y disponible sin interpolación.

0 votos

Supongo que me he perdido algo aquí -- he intentado varias veces averiguar a qué ventaja te refieres en esta mejora sobre lo que hice en el punto 3 (que ya lo trata como función simple de una chi-cuadrado con d.f. entero pequeño, como sugeriría el teorema de Slutsky como df2 $\to\infty$ ). En el ejemplo que nos ocupa, mi aproximación es a la vez más sencilla de realizar y más precisa (por ejemplo, tiene alrededor del 57% del error absoluto). ¿Es esta sugerencia mejor en otros valores de los dos df, o mejor porque es conservadora en lugar de anticonservadora, ...

0 votos

... o la intención es que los errores de los dos enfoques sean de sentido contrario (¿sugiriendo quizás combinar los dos?).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X