8 votos

Información de Fisher para $\rho$ en una distribución normal bivariada

He visto muchas veces que la gente utiliza el método Delta para encontrar la distribución asintótica de $r$ el coeficiente de correlación muestral, para datos normales bivariados. Esta distribución viene dada por

$$\sqrt{n} \left( r-\rho \right) \xrightarrow{D} \mathcal{N} \left(0, \left(1-\rho^2\right)^2 \right)$$

y este es un resultado bien conocido (conozco la transformación z pero no es necesaria en este contexto). Entiendo el método pero lo que me he preguntado es, por qué no hacen algo más sencillo. Por la invariancia de los mles de las medias y varianzas muestrales, es fácil demostrar que el coeficiente de correlación muestral es de hecho el mle de $\rho$ . Ahora bien, como se trata de una mle, bajo las condiciones de regularidad, debería seguir la distribución asintótica de la mle, a saber

$$\sqrt{n} \left(r - \rho \right)\xrightarrow{D} \mathcal{N} \left(0, I^{-1} (\rho) \right)$$

donde $I(\rho)$ es la información de Fisher para $\rho$ . Ahora sólo queda encontrar $I(\rho)$ . Diferenciando dos veces el logaritmo de la distribución normal bivariada con respecto a $\rho$ y tomando la expectativa negativa, creo que se llega a

$$I(\rho) = \frac{1+\rho^2}{\left(1-\rho^2\right)^2}$$

que, suponiendo que no me haya equivocado en el largo cálculo, es muy diferente de la varianza asintótica anterior, al menos para los no tan pequeños $\rho$ . Incluso he realizado algunas simulaciones que muestran que el método delta es muy superior en la mayoría de los casos. La menor varianza asintótica está en consonancia con lo que cabría esperar de la mle, sin embargo resulta ser una muy mala aproximación.

No es imposible que me haya equivocado en alguna parte, aunque lo he comprobado una y otra vez. Si no es así, ¿hay un error conceptual en el razonamiento anterior? He consultado algunos libros famosos sobre inferencia y en ningún lugar mencionan la información de Fisher para $\rho$ Lo cual también me parece bastante desconcertante.

Le agradecería cualquier idea al respecto. Gracias.

0 votos

Echa un vistazo a esta respuesta mía, stats.stackexchange.com/a/111963/28746 No puedo decir si es relevante para su situación, porque no está claro en su pregunta cómo se tratan las medias y las varianzas.

0 votos

El valor de $I(\rho)$ que has encontrado es correcto.

6voto

Jeff Bauer Puntos 236

El OP aclaró en un comentario que examina el estándar distribución normal bivariada, con medias y varianzas fijadas en cero y en la unidad, respectivamente,

$$f(x,y) = \frac{1}{2 \pi \sqrt{1-\rho^2}} \exp\left\{-\frac{x^2 +y^2 -2\rho xy}{2(1-\rho^2)}\right\} $$

A su vez, esto hace que la distribución sea un miembro del curvado familia exponencial, y, como he demostrado en mi respuesta a este post el estimador de máxima verosimilitud para $\rho$ en tal caso no es igual al coeficiente de correlación de la muestra. En concreto, el coeficiente de correlación de la muestra es

$$\tilde r = \frac 1n\sum_{i=1}^nx_iy_i$$

Denota $\hat \rho$ el mle para $\rho$ y $(1/n)\sum_{i=1}^n(x_i^2 +y_i^2) = (1/n)S_2$ para ser la suma de los muestra desviaciones de $X$ y $Y$ obtenemos

$$\hat \rho: \hat \rho^3 -\tilde r \hat \rho^2 + \big[(1/n)S_2-1\big]\hat \rho -\tilde r=0$$

$$\Rightarrow \hat \rho\Big(\hat \rho^2 -\tilde r \hat \rho + \big[(1/n)S_2-1\big] \Big) = \tilde r$$

Haciendo el álgebra, no es difícil concluir que obtendremos $\hat \rho = \tilde r$ si, y sólo si, $(1/n)S_2 =2$ es decir, sólo si resulta que la suma de las varianzas muestrales es igual a la suma de las varianzas reales. Así que, en general, para muestras finitas,

$$\hat \rho \neq \tilde r$$

Ambas siguen siendo consistentes, pero esto por sí solo no implica que la asintótica distribución del coeficiente de correlación de la muestra alcanzará el límite de Cramer-Rao, que es el encontrado por la OP. Y no lo hace.

0 votos

Pero no es $r$ el mle para $\rho$ ? La invariancia de la mle sigue en juego ¿no?

0 votos

@JohnK No es así, esta es exactamente la cuestión aquí. El estimador del Método de los Momentos y el mle para $\rho$ no coinciden.

0 votos

Gracias por aclararlo. Me parece que no hay una solución de forma cerrada para la mle de $\rho$ pero si se resuelve de forma iterativa, la información inversa de Fisher en ese caso es la varianza asintótica, ¿no? Nuevamente esto enfatiza la eficiencia del mle, comparado con los estimadores del mom.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X