3 votos

Bondad de ajuste -- $\chi^2$ Estadísticas

Tengo una pregunta elemental sobre $\chi^2$ estadística. Digamos que un experimento realiza un conjunto de mediciones $E_i \pm \delta_i$ con $i=1, \ldots, n$ . $\delta_i$ son los las incertidumbres de las mediciones experimentales. Supongamos que una teoría predice que los valores son $T_i$ de nuevo con $i=1, \ldots, n$ . Tenemos que determinar si la teoría se ajusta bien a los datos experimentales.

¿Se considera el $E_i-T_i \sim N(0, \delta_i^2)$ ? Es decir, ¿son los errores $E_i-T_i$ se supone que se distribuye normalmente con varianza $\delta_i^2$ ? Si la respuesta es afirmativa, entonces suponiendo que los errores son independientes, podemos tomar $\sum_{i=1}^n \frac{(E_i-T_i)^2}{\delta_i^2}$ ser un $\chi^2$ variable aleatoria con $n$ grados de libertad. Mi pregunta es, ¿cuál es la justificación para tomar $\delta_i$ para ser el estimador de $\sigma_i$ la desviación típica real de la variable de error $E_i-T_i$ ?

Independientemente, ¿cuál es el método más utilizado para calibrar la bondad del ajuste en la hipótesis anterior?

2voto

Ben Puntos 11

Por supuesto, no se puede afirmar con certeza que la $E_i - T_i$ se distribuyen normalmente (en teoría, podrían obedecer a cualquier distribución de probabilidad, en función del montaje experimental y de la teoría subyacente). Sin embargo, debido a la Teorema central del límite y muchas fluctuaciones aleatorias incontroladas presentes en cualquier medición, a menudo es una muy buena aproximación tratarlas como distribuidas normalmente.

Con esta concesión, entonces sí tiene razón. Puede tratar $\sum_{i=1}^n (E_i-T_i)^2/\delta_i^2$ ser un $\chi^2$ variable aleatoria con $n$ grados de libertad. Pero tenga en cuenta que el $\chi^2$ distribución es definido como la suma de $n$ Gaussianos normalizados estadísticamente independientes, por lo que además debe asegurarse de que sus mediciones $E_i$ son independientes entre sí. Por supuesto, también debe garantizar 0 error sistemático para sus mediciones.

Un hecho empírico potencialmente relevante que merece la pena destacar es que, en la naturaleza, las distribuciones tienden a tener colas más grandes de lo que se predice tratando todo como una gaussiana. Es decir, la probabilidad de que haya valores atípicos es mayor de lo que predice el Teorema Central del Límite. En concreto, las distribuciones tienden a estar más cerca de distribuciones log-normal .

Pero, de nuevo, tenga en cuenta que básicamente toda la estadística funciona bajo el supuesto de que todo es una gaussiana, así que no se preocupe demasiado por esos tecnicismos.

En cuanto a una forma estándar de medir la bondad del ajuste, se puede utilizar el parámetro Q de bondad del ajuste (del que hablo en mi referencia más abajo; probablemente esté en algún sitio de Wikipedia, pero no he podido encontrarlo fácilmente), o el parámetro $\chi^2$ por grado de libertad son métricas razonables.

Todo esto lo aprendí de Todo lo que quería saber sobre análisis y ajuste de datos pero no se atrevía a preguntar por Peter Young. Es cierto que está ligeramente sesgado hacia las técnicas de la QCD reticular (en concreto, bootstrap y jackknife), pero también responde de forma pedagógica a todas las preguntas que has planteado más arriba.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X