¡La distribución chi-cuadrado es errónea!
Los dos principales usos estadísticos del distribución chi-cuadrado son dar la distribución asintótica (y en algunos casos exacta) de los estimadores de varianza, y dar la distribución asintótica de los estadísticos de prueba relativos a las desviaciones al cuadrado. En ambos casos, la distribución chi-cuadrado está en la "escala" equivocada y esto significa que los resultados relativos a la distribución chi-cuadrado generalmente requieren la inclusión de una constante de escala para poner la cantidad de interés en la misma escala que la distribución.
Por ejemplo, consideremos algunos de los resultados estadísticos estándar en los que utilizamos la distribución chi-cuadrado. Al observar la distribución de la varianza de la muestra $S^2$ o la varianza de la muestra ajustada a la media real $S_\mu^2$ tenemos los resultados asintóticos estándar (exactos para datos normales):
$$\begin{align} n \cdot \frac{S_\mu^2}{\sigma^2} &\sim \text{ChiSq}(n), \\[12pt] (n-1) \cdot \frac{S^2}{\sigma^2} &\sim \text{ChiSq}(n-1). \\[6pt] \end{align}$$
Del mismo modo, al construir el Distribución F Para probar las proporciones de las varianzas, definimos el estadístico F como:
$$F = \frac{\chi_{n_1}^2/n_1}{\chi_{n_2}^2/n_2} \sim \text{F}(n_1,n_2).$$
Obtenemos un problema de escala similar cuando utilizamos el Estadística de la prueba de Pearson . En esta prueba, el encuadre en términos de la distribución chi-cuadrado funciona en la escala de recuentos de células esperados en lugar de la escala más natural de probabilidades. Esto se ve fácilmente al examinar la prueba de Pearson para datos multinomiales. Con $n$ valores sobre $k$ obtenemos la estadística de la prueba y la distribución nula:
$$n \sum_{i=1}^k \frac{(\hat{p}_i - p_i)^2}{p_i} \overset{H_0}{\sim} \text{ChiSq}(n-1).$$
Obsérvese que en todos estos resultados estadísticos hay una molesta constante de escala, que está ahí únicamente para compensar el hecho de que la distribución chi-cuadrado está en una escala no natural para empezar (es decir, ¡la distribución chi-cuadrado está mal!). Se puede obtener un marco más sencillo de estos resultados reescalando la distribución para que esté en una escala más natural para empezar, lo que significa que ya no necesitamos constantes de escala en las ecuaciones.
(Un corolario obvio de mi posición es que el distribución de chi también es errónea --- recomiendo que esta distribución también sea replanteada mutatis mutandis con la distribución chi-cuadrado).
Reencuadrar la distribución: Para reformular estas distribuciones, consideremos un conjunto de variables aleatorias normales estándar IID $Z_1,...,Z_k \sim \text{N}(0,1)$ y luego denotar el media de los cuadrados de estos valores como:
$$\eta_k^2 = \frac{\chi_k^2}{k} = \frac{1}{k} \sum_{i=1}^k Z_i^2.$$
Esto nos lleva a definir el distribución eta-cuadrado que es una versión escalada de la distribución chi-cuadrado, escalada para dar una media unitaria. La distribución $\eta_k^2 \sim \text{EtaSq}(k)$ puede caracterizarse por sus funciones de densidad:
$$\begin{align} \text{EtaSq}(x|k) = \text{Ga}(x|\tfrac{k}{2},\tfrac{k}{2}) = \frac{(k/2)^{k/2}}{\Gamma(k/2)} \cdot x^{k/2-1} \exp \bigg( -\frac{k x}{2} \bigg) \cdot \mathbb{I}(x \geqslant 0), \end{align}$$
La distribución eta-cuadrada tiene una media $\mathbb{E}(\eta_k^2) = 1$ y la varianza $\mathbb{V}(\eta_k^2) = \tfrac{2}{k}$ por lo que es trivial ver que $\eta_k^2 \rightarrow 1$ como $k \rightarrow \infty$ . Esta distribución nos permite reformular varios resultados estándar en probabilidad y estadística en formas más simples.
Ventaja 1: Ahora tenemos resultados de la varianza de la muestra más sencillos. Si tenemos $n$ puntos de datos, entonces las distribuciones de la varianza de la muestra pueden escribirse como
$$\frac{S^2}{\sigma^2} \sim \text{EtaSq}(n-1) \quad \quad \quad \frac{S_\mu^2}{\sigma^2} \sim \text{EtaSq}(n).$$
Se trata de ecuaciones más sencillas que las planteadas en términos de la distribución chi-cuadrado. Como se ha señalado anteriormente, es trivial a partir de los momentos ver que esta relación converge a uno como $n \rightarrow \infty$ lo que significa que la varianza de la muestra converge a la varianza real.
Ventaja 2: Ahora tenemos una transición más natural hacia la distribución F, que no es más que la distribución del cociente de variables aleatorias independientes eta-cuadrado. Tomando valores independientes $\eta_{k_1}^2 \sim \text{EtaSq}(k_1)$ y $\eta_{k_2}^2 \sim \text{EtaSq}(k_2)$ que tenemos:
$$F = \frac{\eta_{k_1}^2}{\eta_{k_2}^2} \sim \text{F}(k_1,k_2)$$
Ventaja 3: Ahora tenemos la versión más sencilla de la prueba de Pearson para datos multinomiales. Con $n$ valores sobre $k$ obtenemos la estadística de la prueba y la distribución nula:
$$\frac{n}{n-1} \sum_{i=1}^k \frac{(\hat{p}_i - p_i)^2}{p_i} \overset{H_0}{\sim} \text{EtaSq}(n-1).$$
Aunque todavía hay una constante de escala en esta ecuación, para grandes $n$ esta constante de escala apenas afecta al resultado, y podemos obtener un resultado razonable incluso si la eliminamos. En cualquier caso, el resultado es más natural que el correspondiente a la distribución chi-cuadrado, en la medida en que ahora estamos trabajando en la escala de las probabilidades en lugar de los recuentos esperados.