A raíz de un reciente voto negativo, he tratado de comprobar mi comprensión de la prueba Chi-Cuadrado de Pearson. Suelo utilizar el estadístico chi cuadrado (o el estadístico chi cuadrado reducido) para ajustar o comprobar el ajuste resultante. En este caso, la varianza no suele ser el número esperado de recuentos en una tabla o histograma, sino alguna varianza determinada experimentalmente. En cualquier caso, siempre tuve la impresión de que la prueba seguía utilizando la normalidad asintótica de la PDF multinomial (es decir, mi estadística de prueba es
$$Q = (n-Nm)^\top V^{-1}(n-Nm)$$
y $(n-Nm)$ es asintóticamente multinormal donde $V$ es la matriz de covarianza). Por lo tanto, $Q$ tiene una distribución chi-cuadrado dada una gran $n$ por lo que utilizar el número esperado de recuentos como denominador en la estadística es válido para grandes $n$ . Es posible que esto sólo sea cierto para los histogramas, no he analizado una pequeña tabla de datos en años.
¿Hay algún argumento más sutil que me esté perdiendo? Me interesaría una referencia, o incluso mejor una breve explicación. (Aunque es posible que me hayan votado en contra por omitir la palabra asintótica, que reconozco que es bastante importante).
0 votos
A partir de ahí, es de suponer que también se podría utilizar exactamente la misma prueba con cualquier dato de distribución normal. Si yo utilizara un voltímetro que supiera que tiene un error normalmente distribuido que yo hubiera determinado, podría utilizar, $$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$$ . ¿Es esto cierto? Se supone que el estadístico chi cuadrado reducido se basa en este hecho.