Los resultados básicos de la chi-cuadrado de bondad de ajuste de prueba puede ser entendido de forma jerárquica.
Nivel 0. El clásico de Pearson chi-cuadrado de la prueba estadística para la prueba de una multinomial muestra en contra de una probabilidad fija de vectores $p$ es
$$
X^2(p) = \sum_{i=1}^k \frac {X^{(n)}_i - n p_i)^2}{n p_i} \stackrel{d} {\} \chi_{k-1}^2 \>,
$$
donde $X_i^{(n)}$ indica el número de resultados en la $i$th de células de una muestra de tamaño $n$. Esto puede lograrse visto como el cuadrado de la norma del vector $\mathbf Y_n = (Y_1^{(n)},\ldots,Y_k^{(n)})$ donde $Y_i^{(n)} = (X_i^{(n)} - n p_i)/\sqrt{n p_i}$ que, por el multivariante teorema del límite central converge en distribución como
$$
\mathbf Y_n \stackrel{d} {\} \mathcal N(0, \mathbf I - \sqrt{p}\sqrt{p}^T) \>.
$$
De esto podemos ver que $X^2 = \|\mathbf Y_n\|^2 \to \chi^2_{k-1}$ desde $\mathbf I - \sqrt{p}\sqrt{p}^T$ es idempotente de rango $k-1$.
Nivel 1. En el siguiente nivel de la jerarquía, consideramos compuesto de hipótesis con multinomial muestras. Desde el exacto $p$ de interés es desconocido bajo la hipótesis nula, tenemos que estimar. Si la hipótesis nula es compuesto y compuesto de un lineal subespacio de dimensión $m$, entonces el máximo de estimaciones de probabilidad (o de otros estimadores eficientes) de la $p_i$ puede ser utilizado como "plug-in" de los estimadores. Entonces, la estadística
$$
X^2_1 = \sum_{i=1}^k \frac {X^{(n)}_i - n \hat{p}_i)^2}{n \hat{p}_i} \stackrel{d} {\} \chi_{k-m - 1}^2 \>,
$$
bajo la hipótesis nula.
Nivel 2. Considere el caso de la bondad de las pruebas de ajuste de un modelo paramétrico, donde las células son fijas y conocidas de antemano: Por ejemplo, tenemos una muestra de una distribución exponencial con una tasa de $\lambda$ y de esto se produce una multinomial de la muestra por hurgar en la basura con $k$ células, entonces el resultado anterior aún se mantiene, siempre que el uso eficiente de las estimaciones (por ejemplo, Emv) de la papelera de probabilidades, utilizando sólo las frecuencias observadas.
Si el número de parámetros para la distribución es $m$ (por ejemplo, $m = 1$ en el exponencial caso), entonces
$$
X^2_2 = \sum_{i=1}^k \frac {X^{(n)}_i - n \hat{p}_i)^2}{n \hat{p}_i} \stackrel{d} {\} \chi_{k-m - 1}^2 \>,
$$
donde aquí $\hat{p}_i$ puede ser llevado a ser la Emv de la célula de las probabilidades de la fija, las células conocidas correspondiente a la distribución dada de interés.
Nivel 3. Pero, ¡espera! Si tenemos una muestra $Z_1,\ldots,Z_n \sim F_\lambda$, ¿por qué no hemos de estimar la $\lambda$ eficiente en primer lugar, y, a continuación, utilizar un estadístico de chi-cuadrado con nuestro fijo, las células conocidas? Así, se puede, pero en general ya no estamos en una distribución de la chi cuadrado para el correspondiente estadístico de chi-cuadrado. De hecho, Chernoff y Lehmann (1954) demostraron que el uso de Emv para la estimación de los parámetros y, a continuación, a enchufarlos para obtener las estimaciones de las células de las probabilidades de los resultados en un no-distribución de la chi cuadrado, en general. Bajo adecuadas condiciones de regularidad, la distribución es (estocástico) entre un $\chi_{k-m-1}^2$ $\chi_{k-1}^2$ variable aleatoria con la distribución en función de los parámetros.
Untuitively, esto significa que la limitación de la distribución de $\mathbf Y_n$$\mathcal N(0, \mathbf I - \sqrt{p_\lambda}\sqrt{p_\lambda}^T - \mathbf A(\lambda))$.
Aún no hemos hablado de azar con los límites de celda sin embargo, y ya estamos en un poco de un aprieto! Hay dos maneras: Una es a retroceder al Nivel 2, o al menos no de uso eficiente de los estimadores (como Emv) de la base de parámetros de $\lambda$. El segundo enfoque es tratar de deshacer los efectos de las $\mathbf A(\lambda)$ de tal manera como para recuperar un chi-cuadrado de distribución.
Hay varias maneras de ir a la última ruta. Básicamente, la cantidad a premultiplying $\mathbf Y_n$ por el "derecho" de la matriz $\mathbf B(\hat{\lambda})$. Entonces, la forma cuadrática
$$
\mathbf Y_n^T \mathbf B^T \mathbf B \mathbf Y_n \stackrel{d} {\} \chi_{k-1}^2 \>,
$$
donde $k$ es el número de células.
Ejemplos de ello son el Rao–Robson–Nikulin estadística y la Dzhaparidze–Nikulin estadística.
Nivel 4. Al azar de las células. En el caso de random células, bajo ciertas condiciones de regularidad, terminamos en la misma situación que en el Nivel 3 si tomamos la ruta de la modificación de la prueba de Pearson estadístico de chi-cuadrado. Ubicación-de la escala de las familias, en particular, se comportan muy bien. Un enfoque común es tomar nuestra $k$ células cada uno tiene probabilidad de $1/k$, nominalmente. Así, aleatorios, las células son los intervalos de la forma $\hat{I}_j = \hat \mu + \hat\sigma I_{0,j}$ donde $I_{0,j} = [F^{-1}((j-1)/k), F^{-1}(j/k))$. Este resultado ha sido ampliado para el caso de que el número aleatorio de células crece con el tamaño de la muestra.
Referencias
Un W. van der Vaart (1998), Asintótica Estadísticas, Cambridge University Press. Capítulo 17: El Test De Chi Cuadrado.
H. Chernoff y E. L. Lehmann (1954), el uso de La máxima de estimaciones de probabilidad en $\chi^2$ pruebas de bondad de ajuste, Ann. De matemáticas. Estatismo., vol. 25, no. 3, 579-586.
F. C. Drost (1989), Generalizada de la chi-cuadrado de bondad de ajuste de las pruebas para la ubicación de los modelos a escala cuando el número de clases que tiende a infinito, Ann. Stat, vol. 17, no. 3, 1285-1300.
M. S. Nikulin, M. S. (1973), La prueba de Chi-cuadrado para la distribución continua con
cambio y la escala de los parámetros, la Teoría de la Probabilidad y sus Aplicaciones, vol. 19, no. 3, 559-568.
K. O. Dzaparidze y M. S. Nikulin (1973), Sobre la modificación de la norma estadística de Pearson, la Teoría de la Probabilidad y sus Aplicaciones, vol. 19, no. 4, 851-853.
K. C. Rao y D. S. Robson (1974), Un estadístico de chi-cuadrado para la bondad de ajuste de las pruebas dentro de los exponencial de la familia, Comm. Estatismo., vol 3., no. 12, 1139-1153.
N. Balakrishnan, V. Voinov y M. S. Nikulin (2013), Chi-Cuadrado de Bondad de Ajuste de las Pruebas Con las Aplicaciones, Academic Press.