1 votos

¿Si $\chi^2=0$ para un conjunto de datos, las frecuencias de los valores en la tabla de contingencia son todas iguales?

¿Podría decir que si el valor $\chi^2$ de un conjunto de datos es $0$, entonces las frecuencias de los valores de las celdas en la tabla de contingencia son todas iguales? He notado que si cambio la frecuencia de cualquiera de estos valores para que sea mayor que los demás, $\chi^2$ deja de ser $0$.

$$\begin{array}{lcc}\quad&1&2\\1&8&8\\2&8&8\end{array}$$

$\chi^2=0$

Cualquier ayuda será apreciada

4voto

Michael Hardy Puntos 128804

Depende de qué prueba de chi-cuadrado estés hablando. Hay muchas. Una prueba de chi-cuadrado frecuentemente utilizada con tablas de contingencia es una prueba de independencia de filas y columnas. Considera esta tabla: $$ \begin{array}{rr|r} \hline 2 & 12 & 14 \\ 3 & 18 & 21 \\ \hline 5 & 30 & 35 \end{array} $$ Los números en la columna más a la derecha a la derecha de la línea vertical son las sumas de los números en las filas a la izquierda de la línea; los números en la fila inferior debajo de la línea horizontal son las sumas de los números en las columnas por encima de la línea; el 35 en la esquina inferior derecha es la suma de los dos números por encima de él, o equivalente, de los dos números a su izquierda, o, nuevamente equivalente, de los cuatro números en la tabla $2\times 2$ arriba y a la izquierda de los márgenes.

Toma el número en cada celda en la tabla $2\times 2$ como el número de individuos en la muestra que caen en esa celda. La hipótesis nula dice que la probabilidad de que un individuo esté en una fila en particular es independiente de en qué columna está ese individuo y viceversa. Los números observados son totales en la muestra en lugar de en la población, por lo que generalmente no verás una independencia perfecta en la muestra incluso si la hipótesis nula es verdadera. Dado que se basan en la muestra en lugar de en toda la población, si decimos que la probabilidad de estar en la primera fila es $14/35 = 2/5$ (tomando los números 14 y 21 del margen derecho), eso es una estimación. De manera similar, podemos estimar la probabilidad de estar en la primera columna como $5/35 = 1/7$. La probabilidad de estar en la celda que es la esquina superior izquierda de la tabla, asumiendo que la hipótesis nula de independencia es verdadera, se estima por lo tanto como $(14/35) \times (5/35) = 2/35$. Dado que el tamaño de la muestra es 35, el recuento esperado en la primera celda es, por lo tanto, $(14/35) \times (5/35) \times 35$ (y la cancelación obvia de 35 con 35 ocurriría incluso si todos los números hubieran sido diferentes). Llama a este valor esperado estimado el recuento esperado en la primera celda.

En varias pruebas de chi-cuadrado (no todas las pruebas de chi-cuadrado, pero la mayoría de las pruebas de chi-cuadrado que involucran datos categóricos), la estadística de prueba se puede escribir como $$ \sum \frac{(\text{observado} - \text{esperado})^2}{\text{esperado}}. $$

Si calculas la estadística de prueba de chi-cuadrado para la tabla con los números particulares que he puesto allí, encontrarás que es exactamente 0, simplemente porque elegí los números para que eso suceda.

Pero los cuatro números no son iguales.

Por otro lado, si estás haciendo la simple prueba de chi-cuadrado de la hipótesis nula que dice que un dado de seis caras es "justo", entonces los recuentos "esperados" serán cada uno $1/6$ del tamaño de la muestra---así que todos iguales entre sí---y la estadística de prueba de chi-cuadrado entonces no será 0 a menos que todos los seis recuentos en la muestra sean iguales.

Respuesta final a tu pregunta: No.

4voto

Justin Walgran Puntos 552

Una respuesta más corta que la de Michael Hardy (que es buena, por cierto): las estadísticas de prueba con las que estás tratando probablemente tienen la forma $$ \sum_i {(O_i - E_i)^2 \over E_i}. $$ donde $O_i$ son los recuentos observados y $E_i$ son los recuentos esperados. Esto será cero, no si todos los $O_i$ son iguales, sino si todos los $O_i$ son iguales a los correspondientes $E_i$. Es decir, chi-cuadrado es cero en estos casos si los recuentos observados son iguales a los recuentos esperados correspondientes.

Ahora, dado que el numerador de cada término en la suma es no negativo, entonces cada término en la suma es no negativo. Y si los recuentos observados no son todos iguales a los recuentos esperados correspondientes, entonces al menos un término es realmente positivo, por lo que chi-cuadrado es mayor que cero.

Por lo tanto, chi-cuadrado es igual a cero si, y solo si, los recuentos observados son iguales a los recuentos esperados. (Esto sucede raramente porque hay fluctuaciones inevitables; por eso requerimos que chi-cuadrado sea un número razonablemente grande para rechazar la hipótesis de que las distribuciones observadas y esperadas sean las mismas.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X