4 votos

¿Cómo puedo calcular la varianza-covarianza de la matriz de un conjunto de 2-D de puntos de datos con errores: (x, y, dy)

Yo estoy haciendo un ponderado lineal de mínimos cuadrados para N valores medidos de la forma $(x, y, dy)$ donde $x$ es la variable independiente, $y$ es la variable independiente, y $dy$ es el error de estimación de la variable independiente. Siguiendo los enlaces de la página de wikipedia, soy capaz de conseguir los dos ajuste de los parámetros, pero no ha sido capaz de obtener el parámetro de errores. El artículo muestra que la varianza-covarianza de la matriz de los parámetros, $M^\beta$, puede ser calculada usando $$M^\beta = (X^T W X)^{-1} W M W^T X(X^T W^T X)^{-1}\,,$$ donde $X$ $n \times 2$ matriz de la $x$-valores y, $W$ $n \times n$ matriz diagonal con $1/dy_i^2$ los valores en la diagonal, y $M$ es la varianza-covarianza de la matriz para las observaciones. ¿Cómo puedo calcular el $M$ de mi $(x, y, dy)$ datos?

Esta relacionada con la pregunta y este post uso $$M_{jk} = \frac{1}{N-1} \sum_{i=1}^{N}(x_{ij} - \bar{x_j})(x_{ik} - \bar{x_k})$$ pero debe $dy$ afectar de alguna manera esto? Esto es fácil de calcular, pero no estoy seguro de que el índice de la $x$ o $y$ valores que debe tomar (con esto solo ser un 2$\times$2 matriz simétrica sólo afecta a la diagonal).

El artículo menciona una importante simplificación de la $W = M^{-1}$ pero no estoy seguro de si este es el caso de mis datos. Hay una manera sencilla de saber que esto es cierto sin el cálculo de $M$?

1voto

wes Puntos 2856

Mientras que esto no responde a la pregunta (y por lo tanto, no serán aceptados), me ofrecen esta respuesta con la esperanza de que ayude a los demás y promover la pena de discusión.

En su libro la Experimentación: Una Introducción a la Teoría de la Medición y Diseño de experimentos, David Baird proporciona una explicación sencilla para hacer un lineal de mínimos cuadrados utilizando el diffences entre la medida y ajuste los valores para estimar el error del ajuste de los parámetros. El mejor ajuste para los parámetros de $m$ $b$ $$y=mx+b$ $ se determina mediante su eqn. (6.3):

$$m = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum(x^2_i) - (\sum x_i)^2} $$

$$b = \frac{\sum(x_i^2)\sum y_i - \sum x_i \sum x_iy_i}{n\sum(x^2_i) - (\sum x_i)^2} $$

Después de la obtención de $m$$b$, una desviación estándar para el ajuste de los parámetros puede ser obtenida mediante el cálculo de las diferencias de cada una de las $y_i$ valor del ajuste, $\delta y_i = y_i - (m x_i +b)$. A partir de estas diferencias, se calcula la desviación estándar de los datos de la línea de ajuste utilizando:

$$\sigma_y = \sqrt{\frac{\sum(\delta y_i)^2}{n-2}}$$

y entonces la desviación estándar de los parámetros a través de $$\sigma_m = \sigma_y \sqrt{\frac{n}{n\sum{x_i^2}-\left(\sum{x_i}\right)^2}}$$ y $$\sigma_b = \sigma_y \sqrt{\frac{\sum{x_i^2}}{n\sum{x_i^2}-\left(\sum{x_i}\right)^2}}$$

Para incluir el error de la medición, $dy_i$, en el ajuste sería de dividir el inicial sistema de ecuaciones por $dy_i$ dar $$\frac{y_i}{dy_i} = m\frac{x_i}{y_i} + b \frac{1}{dy_i}$$, a continuación, repita Baird derivación para obtener el promedio ponderado de ajuste de los parámetros de

$$m = \frac{\sum \frac{1}{dy_i}\sum \frac{x_i y_i}{dy_i^2} - \sum \frac{x_i}{dy_i^2} \sum \frac{y_i}{dy_i}}{\sum \frac{1}{dy_i}\sum \frac{x^2_i}{dy_i^2} - \sum \frac{x_i}{dy_i}\sum \frac{x_i}{dy_i^2}} $$

$$b = \frac{\sum \frac{x_i^2}{dy_i^2}\sum \frac{y_i}{dy_i} - \sum \frac{x_i}{dy_i} \sum \frac{x_iy_i}{dy_i^2}}{\sum \frac{1}{dy_i}\sum \frac{x^2_i}{dy_i^2} - \sum \frac{x_i}{dy_i}\sum \frac{x_i}{dy_i^2}} $$

Observe que el $b\frac{1}{dy_i}$ plazo hace que lo que no puede simplemente dividir $x_i$ $y_i$ $dy_i$ (como se señaló en los comentarios de abajo).

Por desgracia, esto no propagar el error de medición en un error en el ajuste de los parámetros de aunque.

0voto

wes Puntos 2856

Buscando la fórmula para $M^\beta$, se puede deducir las dimensiones de $M$ debe $N \times N$ donde $N$ es el número de puntos de datos. Por lo tanto, la varianza-covarianza de la matriz no es la comparación de todas las $x$'s de todas las $y$'s, que daría un $2 \times 2$ matriz, pero en lugar de comparar el $N$ puntos de datos.

El artículo de wiki explicando la matriz de covarianza de los estados que, "de Hecho, las entradas en la diagonal de la matriz de covarianza $\Sigma$ son las varianzas de cada elemento del vector $\mathbf {X}$." Si estas son las $dy_i^2$, y podemos asumir que los errores entre los puntos no están relacionados, a continuación, $M = W^{-1}$ y la simplificación se aplica.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X