42 votos

Variación del producto de las variables dependientes

¿Cuál es la fórmula de la varianza del producto de las variables dependientes?

En el caso de las variables independientes la fórmula es simple:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 ¿Pero cuál es la fórmula de las variables correlacionadas?

Por cierto, ¿cómo puedo encontrar la correlación basada en los datos estadísticos?

45voto

Niall Puntos 51

Bueno, usando la identidad familiar que señalaste,

var(XY)=E(X2Y2)E(XY)2var(XY)=E(X2Y2)E(XY)2

Utilizando la fórmula análoga para la covarianza,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

y

E(XY)2=[cov(X,Y)+E(X)E(Y)]2E(XY)2=[cov(X,Y)+E(X)E(Y)]2

lo que implica que, en general, var(XY)var(XY) puede escribirse como

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Tenga en cuenta que en el caso de la independencia, cov(X2,Y2)=cov(X,Y)=0cov(X2,Y2)=cov(X,Y)=0 y esto se reduce a

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

y los dos [E(X)E(Y)]2[E(X)E(Y)]2 términos se anulan y se obtiene

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

como ha señalado más arriba.

Editar: Si todo lo que observas es XYXY y no XX y YY por separado, entonces no creo que haya una forma de estimar cov(X,Y)cov(X,Y) o cov(X2,Y2)cov(X2,Y2) excepto en casos especiales (por ejemplo, si X,YX,Y tienen medios que se conocen a priori )

2 votos

¿por qué pones [var(X)+E(X)2][var(Y)+E(Y)2] en lugar de E(X2)E(Y2)?

1 votos

@user35458, por lo que puede terminar con la ecuación como una expresión de var(X) y var(Y), por lo tanto comparable a la declaración de OP. Tenga en cuenta que E(X ^ 2) = Var(X) + E(X) ^ 2.

3 votos

Para responder (fuera de línea) a una impugnación, ahora eliminada, de la validez de esta respuesta, comparé sus resultados con el cálculo directo de la varianza del producto en muchas simulaciones. No es una fórmula práctica para usar si se puede evitar, porque puede perder precisión sustancial a través de la cancelación al restar un término grande de otro - pero ese no es el punto. Un escollo a tener en cuenta es que esta pregunta se refiere a variables aleatorias. Sus resultados se aplican a los datos siempre que se calculen las varianzas y covarianzas utilizando denominadores de nn en lugar de n1n1 (como es habitual en los programas informáticos).

18voto

Dilip Sarwate Puntos 16161

Este es un adenda a la muy buena respuesta de @Macro que expone exactamente lo que hay que saber para determinar la varianza del el producto de dos variables aleatorias correlacionadas. Como \begin {align} \operatorname {var}(XY) &= E \left [(XY)^2 \right ] - \left (E[XY] \right )^2 \tag {1} \\ &= E[(XY)^2] - \left ( \operatorname {cov}(X,Y)+E[X]E[Y] \right )^2 \\ &= E[X^2Y^2] - \left ( \operatorname {cov}(X,Y)+E[X]E[Y] \right )^2 \tag {2} \\ &= \left ( \operatorname {cov}(X^2,Y^2)+E[X^2]E[Y^2] \right ) - \left ( \operatorname {cov}(X,Y)+E[X]E[Y] \right )^2 \tag {3} \\ \end {align} donde cov(X,Y)cov(X,Y) , E[X]E[X] , E[Y]E[Y] , E[X2]E[X2] y E[Y2]E[Y2] se puede suponer que son cantidades conocidas, tenemos que ser capaces de determinar el valor de E[X2Y2]E[X2Y2] en (2)(2) o cov(X2,Y2)cov(X2,Y2) en (3)(3) . Esto no es fácil de hacer en general, pero, como ya se ha señalado, si XX y YY son independiente variables aleatorias, entonces cov(X,Y)=cov(X2,Y2)=0cov(X,Y)=cov(X2,Y2)=0 . De hecho, dependencia, no la correlación (o la falta de ella) es la cuestión clave. Que sepamos que cov(X,Y)cov(X,Y) es igual a 00 en lugar de algún valor no nulo no lo hace, por sí mismo, ayuda en el menos en nuestros esfuerzos son determinar el valor de E[X2Y2]E[X2Y2] o cov(X2,Y2)cov(X2,Y2) a pesar de que hace simplificar los lados derechos de (2)(2) y (3)(3) un poco.

Cuando XX y YY son dependiente variables aleatorias, entonces en al menos una (bastante común o bastante importante) especial caso, es es posible encontrar el valor de E[X2Y2]E[X2Y2] con relativa facilidad.

Supongamos que XX y YY son conjuntamente normal variables aleatorias con coeficiente de correlación ρρ . Entonces, acondicionado en X=xX=x El condicional densidad de YY es una densidad normal con media E[Y]+ρvar(Y)var(X)(xE[X])E[Y]+ρvar(Y)var(X)(xE[X]) y la varianza var(Y)(1ρ2)var(Y)(1ρ2) . Así, \begin {align}E[X^2Y^2 \mid X] &= X^2E[Y^2 \mid X] \\ &= X^2 \left [ \operatorname {var}(Y)(1- \rho ^2) + \left (E[Y] + \rho\left.\left.\sqrt { \frac { \operatorname {var}(Y)}{ \operatorname {var}(X)}} \right (X-E[X] \right ) \right )^2 \right ] \end {align} que es un Cuartita función de XX , digamos que g(X)g(X) y la Ley de la Iteración Expectativa nos dice que E[X2Y2]=E[E[X2Y2X]]=E[g(X)] donde el lado derecho de (4) puede calcularse a partir del conocimiento de los 3er y 4to momento de X -- resultados estándar que se pueden encontrar en muchos textos y libros de referencia (lo que significa que soy demasiado perezoso para buscarlos e incluirlos en esta respuesta).


Más adición: En una respuesta ahora borrada, @Hydrologist da la varianza de XY como Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2 y afirma que esta fórmula procede de dos artículos publicados hace medio siglo en JASA. Esta fórmula es una transcripción incorrecta de los resultados de los artículos citados por Hydrologist. En concreto, Cov[x2,y2] es un error de transcripción de E[(xE[x])2(yE[y])2] en el artículo de la revista, y de forma similar para Cov[x2,y] y Cov[x,y2] .

0 votos

Para el cálculo de E(X2Y2) en el caso de la normalidad conjunta, véase también math.stackexchange.com/questions/668641/

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X