8 votos

$\chi^2$ valor tabulado

Me di cuenta de que el valor crítico $\chi^2$ aumenta a medida que aumentan los grados de libertad en una tabla de $\chi^2$. ¿Por qué sucede eso?

introduce la descripción de la imagen aquí

6voto

jldugger Puntos 7490

Lo siguiente dice lo mismo:

  1. Para un "área a la derecha del valor crítico" dado, llamada $\alpha$ (alfa griega), el valor crítico aumenta con los grados de libertad, llamados $\nu$ (nu griega).

  2. Para un valor crítico dado $c$, $\alpha$ aumenta con $\nu$.

  3. Para cualquier número dado $c$, la probabilidad de que una variable $\chi^2(\nu)$ $W$ exceda a $c$ aumenta a medida que $\nu$ aumenta.

Esto tiene una bonita interpretación gráfica. Imagina rellenando columnas faltantes para otras áreas $\alpha$ como $\alpha=0.5$ o $\alpha=0.000001$. Cada fila individual, para cada $\nu$, expresaría una relación entre todos esos valores de $\alpha$, como se escribe en el encabezado superior, y las entradas $c$. Podemos graficar esta relación. Es convencional colocar $c$ en el eje horizontal y $\alpha$ en el vertical. Así, por ejemplo, la fila superior (para $\nu=21) contiene los diez puntos $(8.033653, 0.995),$ $(8.897198, 0.99),$ $\ldots, (41.401065, 0.005)$, como se muestra en la imagen de la izquierda con los puntos negros:

Figuras

Por supuesto, la curva rellenada tiene que descender desde la probabilidad más alta posible de $1$ hasta el valor más bajo posible de $0$, porque a medida que el valor crítico aumenta, se vuelve menos probable que $W$ lo exceda.

El gráfico de la derecha muestra todos los valores en la tabla, con las columnas faltantes rellenadas con curvas. Cada curva, que es una fila completamente rellenada de la tabla, desciende de izquierda a derecha. Sus formas cambian un poco, tardando más en descender cuanto más a la derecha van. Por lo general, cuando tienes un conjunto de curvas como estas que se desplazan y cambian sus formas, cualquier par de ellas tenderá a cruzarse en algún punto. Sin embargo, en este caso, si fijas una elevación $\alpha$ y observas lo que sucede a medida que $\nu$ aumenta, los puntos en las curvas avanzan consistentemente hacia la derecha: eso es lo que significa que los valores críticos aumentan. Los gráficos más a la izquierda (verde) deben corresponder a los valores más pequeños de $\nu$ cerca de la parte superior de la tabla y los gráficos de la derecha siguen lo que sucede a medida que $\nu$ crece y nos movemos hacia abajo en la tabla. El gráfico más a la derecha (gris) muestra los valores en la última fila de la tabla.

En resumen, estas funciones de distribución acumulativa complementaria nunca se superponen: a medida que $\nu$ aumenta, se desplazan hacia la derecha sin cruzarse nunca.


Eso es lo que está sucediendo. Pero ¿por qué?

Recuerda que una distribución $\chi^2(\nu)$ describe la suma de cuadrados de $\nu$ variables normales estándar independientes. Considera lo que sucede con esa suma de cuadrados:

$$W = X_1^2 + X_2^2 + \cdots + X_\nu^2$$

cuando se agrega otro cuadrado, $X_{\nu+1}^2$. Fija un valor crítico $c$ y supongamos que $W$ tiene una probabilidad $\alpha$ de exceder a $c$. Formalmente,

$$\Pr(W \gt c) = \alpha.$$

Luego, debido a que $X_{\nu+1}^2$ es casi seguramente positivo,

$$\Pr(W + X_{\nu+1}^2 \gt c) = \Pr(W \gt c) + \int_0^c \Pr(X_{\nu+1}^2 \gt \varepsilon) f_\nu(c-\varepsilon)d\varepsilon.$$

Esta expresión descompone la situación donde $W + X_{\nu+1}^2 \gt c$ en una (infinita) colección de posibilidades mutuamente excluyentes. Los axiomas de la probabilidad dicen que la probabilidad total de que $W + X_{\nu+1}^2$ exceda a $c$ debe ser la suma de todas estas probabilidades separadas. He descompuesto la suma en dos partes:

El primer término a la derecha es la probabilidad de que $W$ ya exceda a $c$, en cuyo caso agregar $X_{\nu+1}^2$ solo hace que la suma sea más grande.

El segundo término a la derecha (una integral) contempla todas las posibilidades en las que $W$ no excede a $c$ pero $X_{\nu+1}^2$ es lo suficientemente grande como para hacer que $W+X_{\nu+1}^2$ sea mayor que $c$. Utiliza "$f_\nu$" para representar la función de densidad de probabilidad (PDF) de $W$. Cuando $c \gt 0$, el segundo término es estrictamente positivo (porque puede interpretarse como el área bajo una curva de alturas positivas y extensión horizontal positiva que va de $0$ a $c$).

De manera intuitiva, todo esto dice que agregar otra variable normal cuadrada $X_{\nu+1}^2$ a $W$ solo puede hacer que sea más probable que la suma de cuadrados exceda a $c$. Esa es la afirmación (3), que es lo mismo que (1), como se preguntó en la pregunta.

3voto

Sean Hanley Puntos 2428

Recordemos qué es un $p$-valor. Es la probabilidad de obtener un valor tan lejano o más lejano de un valor de referencia o nulo como su valor observado, si la hipótesis nula es cierta. En tu caso, estás trabajando con $\chi^2$, por lo que es la probabilidad de obtener una estadística de prueba observada $\chi^2$ tan lejana o más lejana del valor esperado si la hipótesis nula es cierta. Además, el $\chi^2$ es básicamente siempre una prueba de una cola (ver aquí), por lo que solo estamos interesados en la probabilidad de encontrar un valor tan alejado hacia la derecha o más hacia la derecha dentro de la distribución nula.

Dado un valor observado de $\chi^2$ y los grados de libertad relevantes, puedes calcular directamente el valor de $p$. Pero no querrías intentarlo con papel y lápiz. Hoy en día, puedes obtener esos valores de $p$ bastante fácilmente con una computadora y software estadístico (como R), pero las tablas como las que muestras eran muy convenientes en los días en que las computadoras no eran tan comunes. La idea era que podías establecer $\alpha$ en cualquiera de los valores enumerados en la parte superior ($0.05$ es el más común) y buscar el valor crítico de $\chi^2$ según tus grados de libertad. Entonces, si el valor de $\chi^2$ de tu análisis era mayor que ese valor crítico, sabías que $p<\alpha$ (aunque en realidad no sabías cuánto menos / cuál era el valor real de $p$).

A partir de lo anterior, podemos ver que tu pregunta se convierte en: '¿Por qué necesitamos un valor de $\chi^2$ observado progresivamente mayor para estar en el $\alpha\%$ superior de la distribución a medida que aumentan los grados de libertad?'

La respuesta es que la distribución nula (más específicamente central) de $\chi^2$ cambia cuando los grados de libertad cambian. Puedes ver esto en la útil trama de @Hamed: El cuantil (valor de $\chi^2$ observado) que separa el $5\%$ superior de la distribución del $95\%$ inferior está aumentando. Considera solo las distribuciones con df = 2 y df = 9:

imagen de descripción

1 votos

¡La trama simplemente parece recapitular lo que el OP ya ha observado! Como escribes, la pregunta no es lo que está sucediendo, sino por qué. Claro, algunas cosas están cambiando obviamente cuando se varía el DF: ¿pero por qué eso debería hacer que todas las entradas en la tabla aumenten de manera uniforme en cada columna? (No todas las distribuciones tabuladas tienen esta propiedad.) También hay que tener en cuenta que la tabla está construida para admitir pruebas de dos colas y pruebas de una cola. Algo para reflexionar: históricamente habría funcionado igual de bien tabular $\chi^2_\nu/\nu$ - pero esos valores no siempre subirían.

0 votos

@whuber, me parece que estás preguntando '¿por qué cambiar el df cambia la distribución?', mientras que simplemente señalo el hecho de que cambiar el df cambia la distribución, y muestro que ese hecho es la razón por la cual el valor crítico está aumentando. Es posible hablar sobre cómo la distribución $\chi^2$ está relacionada con la suma de las varivables normales estándar al cuadrado, pero eso puede ser más / diferente información de la que necesita este OP. Además, todos los valores críticos enumerados son para áreas >al valor, es posible usar eso para obtener valores de dos colas, pero requeriría más sofisticación.

2voto

JayD3e Puntos 141

La distribución chi-cuadrado con $n$ grados de libertad es la suma de los cuadrados de $n$ distribuciones normales (0,1) independientes. Cada sumando tiene un valor esperado positivo, por lo que la distribución chi-cuadrado tendrá una media cada vez mayor a medida que $n$ aumenta. Además, la desviación estándar también aumenta, al igual que los valores críticos.

En concreto, para grandes valores de $n$ la media de la distribución chi-cuadrado es aproximadamente $n$ y la desviación estándar es aproximadamente $\sqrt{2n}$.

1 votos

Esta es la base de una buena explicación pero tiene un fallo lógico. La media podría aumentar concebiblemente mientras las probabilidades de la cola disminuyen. Incluso cuando la media y la desviación estándar aumentan, es posible una disminución en algunas probabilidades de la cola (y no está completamente descartada por la desigualdad de Chebyshev). Por lo tanto, se necesita un argumento más sutil.

0 votos

@whuber. Gracias. Quería mantenerlo simple, ya que el OP no parecía tener mucho conocimiento de estadísticas. "Además" estaba destinado como una afirmación de hecho, no como una implicación del comportamiento de la media. He editado mi respuesta para tener en cuenta tus comentarios. Siéntete libre de editar más.

0voto

Bolo Puntos 181

Creo que la mejor manera de entender es mirando el gráfico de densidad para diferentes grados de libertad.

Si ejecutas el código R a continuación,

x = seq(0, 25, length.out=100)
plot(x, dchisq(x=x, df=2), type='l', col=2, ylab='densidad')
for(i in 3:9){
  y = dchisq(x=x, df=i)
  lines(x, y, col=i)  
}
legend('topright', legend=paste('df = ', 2:9), col=2:9, fill=2:9)

obtendrás este bonito gráfico:

introducir descripción de la imagen aquí

Es claro que con el aumento de grados de libertad, las colas de la distribución se hacen más gruesas. Esto muestra que el $P(X

1 votos

Aunque esta imagen en particular es consistente con la tabla, no constituye ni una explicación ni una prueba.

2 votos

Creo que la trama es muy útil, pero @whuber tiene razón. ¿Quizás podrías hacer explícita la conexión entre esta trama y la respuesta a la pregunta? (Puede que hayas pensado que era tan obvio que no era necesario mencionarlo.)

0 votos

Gracias, la solución teórica se puede obtener encontrando la proporción de dos CDF. Lo haré pronto. Por ejemplo, podemos explicar la mediana para valores crecientes de df.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X