23 votos

La distribución de una observación a nivel de la distancia de Mahalanobis

Si tengo una normal multivariante yo.yo.d. ejemplo de $X_1, \ldots, X_n \sim N_p(\mu,\Sigma)$, y definir $$d_i^2(b,A) = (X_i - b)' A^{-1} (X_i - b)$$ (which is sort of a Mahalanobis distance [squared] from a sample point to the vector $un$ using the matrix $$ for weighting), what is the distribution of $d_i^2(\bar X,S)$ (Mahalanobis distance to the sample mean $\bar X$ using the sample covariance matrix $$S)?

Estoy mirando un papel que dice que es $\chi^2_p$, pero esto es obviamente erróneo: la $\chi^2_p$ distribución habría sido obtenida por $d_i^2(\mu,\Sigma)$ el (desconocido) de la población media de vector y matriz de covarianza. Cuando la muestra análogos están conectados, uno debe obtener un Hotelling $T^{\ 2}$ de la distribución, o a la escala de $F(\cdot)$ de la distribución, o algo parecido, pero no el $\chi^2_p$. No he podido encontrar el resultado exacto en Muirhead (2005), ni en Anderson (2003), ni en Mardia, Kent y Bibby (1979, 2003) . Al parecer, estos chicos no se molestó con las demás diagnósticos, como la distribución normal multivariante es perfecto y es fácil de obtener cada vez que uno recoge datos multivariantes :-/.

Las cosas pueden ser más complicadas que eso. El Hotelling $T^{\ 2}$ distribución del resultado se basa en asumir independencia entre el vector y el de la matriz de parte; esa independencia tiene por $\bar X$$S$, pero no tiene por $X_i$$S$.

5voto

zcrar70 Puntos 133

Echa un vistazo Gaussiano Mezcla de Modelado mediante la Explotación de la Distancia de Mahalanobis (enlace alternativo). Ver página nº 13, Segunda columna. Los autores también se da algún tipo de prueba también para la obtención de la distribución. La distribución es la escala de la beta. Por favor, hágamelo saber si esto no funciona para usted. De lo contrario, pude comprobar cualquier sugerencia en la S. S. Wilks libro mañana.

5voto

Joe Sullivan Puntos 41

Hay 3 relevante de las distribuciones. Como se indicó, si los verdaderos parámetros de la población se utiliza luego de la distribución chi-cuadrado con $df=p$. Esta es también la distribución asintótica con parámetros estimados y gran tamaño de la muestra.

Otra respuesta que da la distribución correcta para la situación más común, con parámetros estimados cuando la observación de sí es parte de la estimación de conjunto: $$ \frac{n(d^2)}{(n-1)^2} \sim Beta\left(\frac{p}{2}, \frac{(n-p-1)}{2}\right). $$ Sin embargo, si la observación de $x_i$ es independiente de las estimaciones de los parámetros, entonces la distribución es proporcional a la de Fisher F-proporción de la distribución: $$ \left(\frac{nd^2(n-p)}{(p(n-1)(n+1)}\right) \sim F(p, n-p) $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X