5 votos

La combinación de dos puntos de datos con diferentes incertidumbres

He separado en dos algoritmos (los llamamos "A1" y "A2") que reconstruir la $(x, y)$-posición de un evento en un detector de partículas. Puedo probar ambos de estos algoritmos en la simulación de eventos de una forma muy precisa de Monte Carlo del experimento. Tenga en cuenta que A1 y A2 de trabajo en diferentes observables en el detector y sus errores no están correlacionados (a pesar de que las características observables sí están correlacionados.) No hay ningún sesgo sistemático con el algoritmo y entonces ... en general el error de reconstrucción en $x$ $y$ es aproximadamente cero en todos los eventos.

Decir A1 reconstruye un determinado MC evento en alguna posición $(x_1, y_1)$, y A2 reconstruye el mismo MC evento en algún posición diferente a $(x_2, y_2)$. Corro A1 y A2 en cada MC evento, y terminan con dos distribuciones: uno que da la distancia (escalar a la distancia, no vectorial) de la verdadera MC posición del evento a $(x_1, y_1)$ para todos los eventos, y uno que da la distancia de la verdadera MC posición del evento a $(x_2, y_2)$ para todos los eventos. Desde esta distancia es necesariamente no-negativo, estas distribuciones tienen algo de positivo valor de la media, y algunos de RMS.

Todo esto está bien: estas dos distribuciones tienen cada uno una media (que caracteriza a la precisión del algoritmo) y un RMS (que caracteriza a la precisión del algoritmo), y las dos distribuciones son más o menos de Gauss. A continuación, desea utilizar estos algoritmos A1 y A2 en los datos reales del detector, y utilizar las propiedades de estos MC distribuciones para poner un límite a la incertidumbre de mi reconstruido posiciones.

Mi pregunta es: sabiendo que el Mper y los medios de la A1 y la A2 distribuciones de distancia, cuando yo uso A1 y A2 en datos reales, yo debería ser capaz de encontrar un "mejor ajuste" punto y poner un poco de incertidumbre. Por un lado, siento que debería simplemente el promedio de las mediciones y la suma de los errores en cuadratura, pero esto es incorrecto, por alguna razón (tal vez porque la media de A2 tiende a ser mucho mayor que la media de A1).

Es esta la manera correcta de ir sobre el análisis de estos datos? Estoy overthinking esto?

1voto

DanielSank Puntos 9248

Como se explica en los comentarios, para un determinado MC caso, los errores de $\delta x$ $\delta y$ para los dos métodos de reconstrucción de A1 y A2 están correlacionadas. Por lo tanto, no hay información adicional se obtuvo mediante el uso de ambas reconstrucciones. Debemos usar simplemente el mejor.

Ahora, ¿qué significa "mejor" significa. Como se indicó en el OP, por tanto reconstrucciones, la distribución de los $\delta x$ $\delta y$ son de Gauss con cero significa. Sin embargo, las desviaciones estándar son diferentes. Suponiendo que para cualquiera de los métodos de reconstrucción $\sigma_{\delta x} = \sigma_{\delta y} \equiv \sigma$, la mejor estrategia es simplemente elija el método con el menor $\sigma$. A diferencia de $\delta x$$\delta y$, el error de la "distancia" $\delta r \equiv \sqrt{\delta x^2 + \delta y^2}$ tiene una distribución que es estrictamente positivo y tiene un valor distinto de cero significa.$^{[a]}$ Como se señaló en el OP, A1 y A2 lugar a dos diferentes distribuciones de $\delta r$, cada una con su propia (positivo) de la media y la varianza. Nota, sin embargo, que la media y la varianza de la distribución de Rayleigh no son independientes (véase el artículo enlazado más abajo), así que realmente sólo desea utilizar el método de reconstrucción con la menor media de $\delta r$, que es el mismo como coger el uno con el más pequeño de Gauss $\sigma$ como se describió anteriormente.

Nuestra afirmación anterior de que debemos utilizar el método de reconstrucción de la que tiene el menor $\sigma$ depende fundamentalmente de que el hecho de que A1 y A2 utilizar el mismo MC de datos. Sin embargo, OP mencionó que en el experimento real A1 y A2 utilizar diferentes observables en el detector. En este caso, se benefician mediante la combinación de los datos de ambos métodos, en esencia, porque más medios de los datos de más información. La pregunta entonces es cómo combinar los resultados. Esta es realmente una pregunta muy interesante.

Para un determinado detector de eventos, tenemos cuatro números: $$x_1, \, y_1, \, x_2, \, y_2$$ donde $x_i$ $x$ coordinar reconstruido por el método de Ai, y lo mismo para $y$. Ahora, basado únicamente en los resultados de A1, nuestro conocimiento de la realidad $x$ posición es

$$P_{X_1}(x|x_1) = \frac{1}{\sqrt{2\pi \sigma_1^2}} \exp \left[-\frac{(x-x_1)^2}{2 \sigma_1^2}\right] \, .$$ Las expresiones para $P_{Y_1}$, $P_{X_2}$, y $P_{Y_2}$ son obvias cosas similares. Ahora la parte interesante: la distribución de la $x$ posición del evento, dado que ambas mediciones A1 y A2 es $$P_{X_{1+2}}(x|x_1,x_2) = \frac{1}{\mathcal{N}} P_{X_1}(x|x_1) P_{X_2}(x|x_2)$$ donde $\mathcal{N}$ es un factor de normalización.

Tenga en cuenta que si cualquiera de A1 o de A2 es mucho mejor que las otras, sólo podía ignorar el peor sin perder mucha precisión.

$[a]$: Por lo que vale, la distribución de $\delta r$ es llamada la distribución de Rayleigh.

0voto

user118480 Puntos 1

Para mí, el uso de la distancia a medir de 2 dimensiones de los datos es dudosa, sobre todo si los eventos están cerca de la reconstrucción de la posición de la (supuesta 0 distancia). Dicen que si los eventos que forman un círculo (el círculo es perfecto gaussiano). La distribución no será más de gauss ya que la zona azul (en el dibujo) será menor que el amarillo:

enter image description here


enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X