15 votos

¿Cómo Karl Pearson venir para arriba con el test de la chi-cuadrado de la estadística?

¿Cómo Pearson llegado a la siguiente Pearson chi-cuadrado de estadísticas en 1900?

$$ K = \sum \frac{(O_{ij} -E_{ij})^2}{E_{ij}} $$ que $$ K \sim \chi^2 $$

Tenía chi-cuadrado en la mente y desarrollar las métricas $K$ (enfoque bottom-up), o hizo concebir la estadística y más tarde demostrar que sigue la distribución chi-squared (top-down)?

Quiero saber por qué eligió esa forma específica y no de otras como la $\sum(O_{ij} -E_{ij})^2$ o $\sum|O_{ij} -E_{ij}|$, y también por qué se divide el cuadrado con el denominador.

23voto

AdamSane Puntos 1825

Pearson 1900 papel de los derechos de autor, por lo que podemos leer en línea.

Usted debe comenzar por señalar que este trabajo es acerca de la bondad de ajuste de la prueba, la prueba de independencia u homogeneidad.

Se procede mediante el trabajo con la normal multivariante, y el test de la chi-cuadrado surge como una suma de los cuadrados de las estandarizado normal varia.

Usted puede ver a partir de la discusión sobre p160-161 claramente está discutiendo la aplicación de la prueba a multinomial de datos distribuidos (no creo que él usa ese término en cualquier lugar). Al parecer, entiende aproximado de la normalidad multivariante de la multinomial (ciertamente, él sabe que los márgenes son aproximadamente normal - que es una muy vieja resultado - y que conoce las medias, varianzas y covarianzas, ya que se indica en el documento); mi conjetura es que la mayoría de las cosas que ya es viejo sombrero por el 1900. (Tenga en cuenta que la distribución chi-squared en sí se remonta a trabajar por Helmert a mediados de la década de 1870.)

Luego por la parte inferior de p163 que se deriva de un estadístico de chi-cuadrado como "una medida de la bondad de ajuste".

A continuación pasa a analizar cómo evaluar el valor de la p* y, a continuación, se indica correctamente la parte superior del área de la cola de un $\chi^2_{12}$ más allá de la 43.87 como 0.000016. [Usted debe tener en cuenta, sin embargo, que él no comprender correctamente cómo ajustar los grados de libertad para la estimación de parámetros en esa etapa, por lo que algunos de los ejemplos en sus papeles usar demasiado alta d.f.]

*(nota de que ni Fisherian ni Neyman-Pearson, prueba de paradigmas existen, no obstante, claramente verlo aplicar el concepto de p-valor ya.)

Tenga en cuenta que él no escribir explícitamente términos como $(O_i-E_i)^2/E_i$. En lugar de eso, él escribe $m_1$, $m_2$ etc para la espera de la cuenta y de lo observado cantidades que él usa $m'_1$ y así sucesivamente. Se define entonces $e = m-m'$ (la mitad inferior p160) y calcula el $e^2/m$ para cada celda (ver eq. (xv) p163 y la última columna de la tabla en la parte inferior de p167) ... cantidades equivalentes, pero en notación diferente.

Gran parte de la actual manera de entender la prueba de chi-cuadrado todavía no está en su lugar, pero, por otro lado, bastante es que ya existe (al menos, si usted sabe qué buscar.) Mucho ha sucedido en la década de 1920 (y en adelante) que cambió la forma de mirar estas cosas.


En cuanto a por qué dividimos por $E_i$ en el caso multinomial, sucede que aunque la varianza de los componentes individuales en una multinomial son más pequeños de lo $E_i$, cuando tomamos en cuenta las covarianzas, es equivalente a dividir por $E_i$, lo que hace que para un buen simplificación.


Añadido en editar:

El documento de 1983 por Plackett da una buena cantidad de contexto histórico, y algo de una guía para el papel. Le recomiendo que se tome una mirada en ella. Parece que es gratuito en línea a través de JStor (si), por lo que no debería ni siquiera necesitan tener acceso a través de una institución a la lectura.

Plackett, R. L. (1983),
"Karl Pearson y la Prueba de Chi-Cuadrado,"
Estadística Internacional De Revisión,
Vol. 51, Nº 1 (Abril), pp 59-72

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X