Pienso en la prueba de la tabla de contingencia. En todos los libros que he visto, la estadística de la prueba se calcula como la suma de (O−E)2/E sobre todas las celdas. Pero el grado de libertad no es el número de todas las celdas. Por ejemplo, en una tabla n×m, es $(n-1)(m-1).
Hasta aquí todo bien. ¿Pero cuál es la lógica detrás de este enfoque? Creo que la definición de la distribución χ2 es la suma de M variables, cada una siendo el cuadrado de una variable normal estándar. Creo que cada (O−E)2/E es aproximadamente una variable normal estándar, y por eso usamos la distribución χ2. ¡Pero el grado de libertad no es el número de sumandos!