1 votos

Cómo medir la varianza de las distancias al origen

Estoy intentando medir la varianza muestral de unos datos. Dichos datos son distancias euclidianas 2D desde el origen (0,0).

Suponiendo que tenemos las 2 componentes X e Y utilizadas para calcular la distancia, es trivial calcular las varianzas $\sigma^2_x$ y $\sigma^2_y$ . Sin embargo, el sistema de medición que estoy evaluando sólo me da una única medida escalar que es la distancia euclidiana (2D) desde el origen. Estas medidas son, por supuesto, siempre positivas y no siguen una distribución gaussiana.

Estoy buscando un único valor escalar para medir la dispersión alrededor del origen, que mapee algo similar a una media de las varianzas $\sigma^2_x$ y $\sigma^2_y$ pero (razonablemente) correcto para obtener alguna puntuación de repetibilidad del sistema de medición (por ejemplo, Cm o Cmk).

Existen algunas condiciones que nos permiten considerar que los componentes X e Y tienen media cero y siguen una distribución gaussiana con varianzas respectivamente $\sigma^2_x$ y $\sigma^2_y$ . También puedo hacer la suposición de que los 2 componentes son independientes, por lo que la distribución 2D resultante puede verse como una distribución gaussiana centrada bivariada con varianzas $\sigma^2_x$ y $\sigma^2_y$ .

¿Cuál puede ser la forma correcta de calcular una medida de "repetibilidad" de estas mediciones, dadas algunas muestras de la salida escalar única "distancia euclidiana 2D desde (0,0)"?

También he encontrado aquí algunos puntos de partida interesantes:

https://en.wikipedia.org/wiki/Noncentral_chi-squared_distribution

http://ballistipedia.com/index.php?title=Circular_Error_Probable

http://ballistipedia.com/index.php?title=Closed_Form_Precision

pero no soy capaz de encontrar una solución a mi problema. ¿Pueden ayudarme?

Gracias de antemano

1voto

Stelios Kounis Puntos 33

La respuesta al título es sencilla. Si tiene algunos datos en $R^2$ a partir de la cual se calcula la distancia euclidiana desde el origen y luego se crea un vector escalar que contiene todas esas distancias, llamando a este vector $d$ Entonces, si quieres la varianza de esas distancias, sólo tienes que calcular de la manera habitual $\sigma_d^2$ . No entiendo su confusión? (tal vez yo interprete mal algo).

0 votos

Simplemente, no estoy seguro de que la "moda habitual" sea matemáticamente correcta, ya que mis medidas son siempre positivas aunque provengan de datos de "media cero". Dados X e Y, puedo calcular $3\sigma_{worst}$ y utilizarlo como mi "puntuación" de repetibilidad (desplazamiento máximo desde el origen). Sin embargo, no es cierto que el 99,73% de las muestras estén contenidas en un círculo de radio $3\sigma_{worst}$ desde el origen: OMI ese radio contendrá más de ese cuantil. Creo que esto es cierto incluso si $\sigma_x=\sigma_y$ . No puedo hacerlo porque las distancias no se distribuyen normalmente como los componentes X,Y.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X