18 votos

Cómo funciona la prueba de Chi-Cuadrado de Pearson

A raíz de un reciente voto negativo, he tratado de comprobar mi comprensión de la prueba Chi-Cuadrado de Pearson. Suelo utilizar el estadístico chi cuadrado (o el estadístico chi cuadrado reducido) para ajustar o comprobar el ajuste resultante. En este caso, la varianza no suele ser el número esperado de recuentos en una tabla o histograma, sino alguna varianza determinada experimentalmente. En cualquier caso, siempre tuve la impresión de que la prueba seguía utilizando la normalidad asintótica de la PDF multinomial (es decir, mi estadística de prueba es

$$Q = (n-Nm)^\top V^{-1}(n-Nm)$$

y $(n-Nm)$ es asintóticamente multinormal donde $V$ es la matriz de covarianza). Por lo tanto, $Q$ tiene una distribución chi-cuadrado dada una gran $n$ por lo que utilizar el número esperado de recuentos como denominador en la estadística es válido para grandes $n$ . Es posible que esto sólo sea cierto para los histogramas, no he analizado una pequeña tabla de datos en años.

¿Hay algún argumento más sutil que me esté perdiendo? Me interesaría una referencia, o incluso mejor una breve explicación. (Aunque es posible que me hayan votado en contra por omitir la palabra asintótica, que reconozco que es bastante importante).

0 votos

A partir de ahí, es de suponer que también se podría utilizar exactamente la misma prueba con cualquier dato de distribución normal. Si yo utilizara un voltímetro que supiera que tiene un error normalmente distribuido que yo hubiera determinado, podría utilizar, $$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$$ . ¿Es esto cierto? Se supone que el estadístico chi cuadrado reducido se basa en este hecho.

1voto

BradHanks Puntos 11

La prueba de Chi-cuadrado está diseñada para analizar datos categóricos. Esto significa que los datos se han contado y dividido en categorías. No funciona con datos paramétricos o continuos. Así que no funciona para determinar el ajuste resultante en todos los casos.

Source : http://www.ling.upenn.edu/~clight/chisquared.htm

4 votos

¡Bienvenido a este sitio! No estoy seguro de entender cómo esto se relaciona con la pregunta en cuestión. ¿Te importaría ampliar un poco esta respuesta, teniendo en cuenta que este hilo es probablemente más sobre bondad de ajuste que el análisis de tablas de contingencia de dos vías?

0 votos

Puede que haya entendido mal la pregunta, pero me preguntaba si la prueba de chi-cuadrado era apropiada en este ejemplo. Puede que esté un poco oxidado...

1 votos

La aplicación descrita en la pregunta es "utilizar el estadístico chi cuadrado... para ajustar o comprobar el ajuste resultante". La distribución de una variable aleatoria se puede comprobar dividiendo sus posibles valores en un número finito de subconjuntos, contando el número de resultados iid que entran en cada subconjunto, y aplicando un $\chi^2$ prueba en los cuenta (que evidentemente son categóricas). En este sentido tiene usted razón y no tiene razón: el $\chi^2$ prueba analiza los recuentos, pero sin embargo hace trabajar con datos continuos. Por cierto, los "datos paramétricos" no tienen sentido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X