8 votos

Límites de la expectativa condicional con márgenes normales y correlación especificada (Pearson)

He visto la siguiente pregunta en otro foro:

"Supongamos que tanto la altura como el peso de los hombres adultos pueden describirse con modelos normales, y que la correlación entre estas variables es de 0,65. Si la altura de un hombre lo sitúa en el percentil 60, ¿en qué percentil esperaría que estuviera su peso?"

Veo que alguien en el foro en cuestión ya ha señalado que la pregunta habla de que los márgenes son normales ( height and weight ... can be described with normal models ), no sobre la normalidad bivariada, por lo que la pregunta no tiene una respuesta única.

Evidentemente, la respuesta dependería de la relación de dependencia bivariada real (la cópula), lo que me dejó curioso.

Mi pregunta es:

Dados unos márgenes normales y una correlación poblacional determinada ( $\rho$ una correlación de Pearson), ¿existe una forma razonablemente sencilla de encontrar límites en $E(Y|X=x_q)$ dado $X,Y$ ambos normales, con correlación $\rho$ ?

Si hay un valor mayor y un valor menor exactos para la expectativa condicional, sería bueno saberlo (y para la preferencia, las circunstancias en que se produce cada uno*).

* Tengo algunas fuertes sospechas sobre cuáles podrían ser esas circunstancias (es decir, el tipo de dependencia que podría estar involucrado; en particular, espero que un tipo específico de distribución degenerada dé los límites) pero todavía no he investigado ese pensamiento en profundidad. (Me imagino que es probable que alguien ya lo sepa).

En su defecto, sería interesante disponer de límites superiores o inferiores para los valores mayores y menores.

No requiero necesariamente una respuesta algebraica (algún algoritmo bastaría), aunque una respuesta algebraica estaría bien.

Las respuestas aproximadas o parciales pueden ser útiles.

Si nadie tiene buenas respuestas, puede que lo intente yo mismo.

4voto

jldugger Puntos 7490

Creo que no hay límites. Esta conclusión se basa en la siguiente construcción, que es la más sencilla de describir para distribuciones continuas arbitrarias. A medida que avancemos, se irán añadiendo condiciones hasta que nos encontremos en el caso de las marginales normales.

Por lo tanto, dejemos que $X$ sea cualquier variable aleatoria continua con función de distribución $F$ . Dado cualquier intervalo semiabierto $(a,b]$ (que acabará siendo muy estrecha), definir

$$\psi: (a,b] \to (-\infty, c]$$

a través de

$$\psi(x) = F^{-1}(F(x) - F(a)).$$

Esto es monótonamente creciente y evidentemente $c = \psi(b) = F^{-1}(F(b)-F(a))$ . Por construcción,

$$\Pr(X \in (a,b]) = \Pr(\psi(X) \le c).$$

Ampliar $\psi$ a un mapa uno a uno $\Psi:\mathbb{R} \to \mathbb{R}$ a través de

$$\eqalign{ \Psi|_{(a,b]} &= \psi, \\ \Psi|_{(-\infty, c]} &= \psi^{-1} }$$

y por otra parte $\Psi(x) = x$ . La distribución de $\Psi(X)$ es idéntico a la de $X$ pero lo que ha hecho es intercambiar los valores entre los dos intervalos $(a,b]$ y $(-\infty, c]$ .

Figure 1: graph of Psi

Ejemplo de $\Psi$ para $(a,b]=(1.5, 1.75]$ .

Sea la correlación de Pearson de $(X,Y)$ sea $\rho \in (-1, 1)$ . (Sin pérdida de generalidad podemos suponer ahora que ambos $X$ y $Y$ se han estandarizado, porque esto no cambiará ni $\rho$ ni la continuidad de $X$ ). Sea $x_q$ sea cualquier número real, como en la pregunta, donde la expectativa condicional de $Y$ debe ser evaluado. Seleccione $(a,b]$ para lo cual $x_q \in (a,b]$ pero que sea tan estrecha que $\Pr(X \in (a,b])$ es pequeño. Entonces el cambio de $\rho = \mathbb{E}(XY)$ a $\rho^\prime = \mathbb{E}(\Psi(X)Y)$ puede hacerse arbitrariamente pequeño. (Se necesita un poco de trabajo para mostrar esto; se reduce al hecho de que la expectativa condicional de $Y$ dado $X\le c$ aumenta con relativa lentitud a medida que $|b-a|$ disminuye. Si no fuera así, $\rho$ no estaría definida). Sin embargo, aplicando $\Psi$ cambia $\mathbb{E}(Y|X=x_q)$ a

$$\mathbb{E}(Y|\Psi(X) = x_q) = \mathbb{E}(Y|X = \Psi(x_q)),$$

que es una expectativa condicional para $Y$ en algún valor de $X$ menor o igual a $c$ .

Figure 2: graph of the PDF of (Psi(X), Y)

Contornos del PDF. Aquí $(a,b] = (1.5, 1.75]$ . La distribución normal bivariada original recibió una correlación de $0.85$ que se redujo a aproximadamente $0.5$ --el valor objetivo-- cuando se intercambiaron las probabilidades en las dos tiras.

Cuando $(X,Y)$ es una distribución normal bivariada, $c\to -\infty$ como $|b-a|\to 0$ . Proporcionado $\rho\ne 0$ la expectativa condicional de $Y$ es empujado a $-\infty$ para $\rho \gt 0$ y a $+\infty$ para $\rho \lt 0$ . Una construcción análoga, intercambiando el intervalo $(a,b]$ con $[c, \infty)$ , empujará la expectativa condicional de $Y$ infinitamente lejos en la otra dirección. Ajustando el valor original de $\rho$ ligeramente podemos compensar el cambio infinitesimal en $\rho$ que tiene lugar, mostrando que sin importar el valor original de $\rho$ puede ser, no podemos decir nada sobre la expectativa condicional de $Y$ en un punto determinado $X=x_q$ .

(La aparente excepción $\rho=0$ puede manejarse partiendo, por ejemplo, de una distribución bivariante con marginales Normales cuyo soporte se limita a las líneas $y=\pm x$ .)

0 votos

+1 Esto es muy interesante. Está algo relacionado con la construcción que tenía en mente al escribir la pregunta, pero es un objetivo mejor para mover sólo el condicional en la vecindad inmediata del cuantil y una discusión más reflexiva de lo que había jugado. Tu conclusión parece a primera vista correcta. Gracias.

0 votos

En realidad +1 es inadecuado aquí.

0voto

Antonio Puntos 1598

Si entiendo bien su pregunta, la respuesta depende de la "relación de dependencia bivariada real (la cópula)" utilizada.

Bueno, existen límites en el valor que puede tomar una cópula, ¿verdad? Entonces, ¿por qué no utilizar la cópula de comonotonicidad y la cópula de contramonotonicidad para establecer los límites?

enter image description here

Fuente: Thorsten Schmidt - Cómo hacer frente a las cópulas

1 votos

La cuestión es más restrictiva que los límites de las cópulas: no se pueden alcanzar los límites de co y contramonotonicidad debido a la restricción de $\rho$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X