Supongamos que $X,Y$ son variables aleatorias continuas distribuidas conjuntamente con función de densidad de probabilidad $f_{X,Y}(x,y)$ . Sé que para recuperar la distribución marginal de una de las variables aleatorias, digamos $Y$ podemos calcular $$f_{Y}(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y) \, dx .$$
Mi pregunta es sobre la informática $E[Y]$ cuando se parte de la situación anterior. Teniendo en cuenta que la definición de la expectativa es $$E[Y] := \int_{-\infty}^{\infty} y \cdot f_{Y}(y) \, dy, $$
Mi enfoque es entonces calcular la expectativa como $$E[Y] = \int_{-\infty}^{\infty} y \cdot f_Y(y) \, dy = \int_{-\infty}^{\infty} y \left[ \int_{\infty}^{\infty} f_{X,Y}(x,y) \, dx \,\right] dy = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} y \cdot f_{X,Y}(x,y) \, dx \, dy. $$
Sin embargo, regularmente veo soluciones que lo computan como $$E[Y] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} y \cdot f_{X,Y}(x,y) \, dy \, dx. $$
Estoy familiarizado con el concepto de cambiar el orden de integración, pero esto parece más que eso. Ya no me queda claro por qué esto sigue encajando en la definición del valor esperado, porque no veo cómo estamos recuperando la pdf marginal de $Y$ y luego integrarlo contra $y$ para llegar a la expectativa. He preguntado a varios amigos que también han resuelto los problemas de esta manera por qué es válido y ninguno parece tener una respuesta y se limitan a decir "¿por qué no se podría calcular así?". Así que o yo estoy loco o ellos son unos estadísticos inconscientes.
En esa nota, me di cuenta en una página de la fórmula en un libro de texto tiene una identidad:
$$E[g(X,Y)] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x,y) \cdot f_{X,Y}(x,y) \, dy \, dx.$$
En lo anterior estoy de acuerdo en que el orden de integración no importa (poniendo X = Y y viceversa). Supongo que en este resultado si se toma la función $g(X,Y) = Y$ permitirá el cómputo sobre el que estoy dudando. ¿Es así como sabemos que podemos hacerlo? ¿O es más sencillo que eso y yo me estoy volviendo loco?
Como ejemplo concreto, he aquí un problema específico en el que la solución aportada utiliza el método sobre el que tengo dudas.
Dejemos que $X$ y $Y$ denotan los valores de dos acciones al final de un período de cinco años. $X$ se distribuye uniformemente en el intervalo $(0,12)$ . Dado $X = x$ , $Y$ se distribuye uniformemente en el intervalo $(0,x)$ . Encuentre $E[Y]$ .
Por favor, recuerda que mi pregunta no es cómo resolver este problema. Es por qué un método específico funciona.
Mi método de resolver esto sería descubrir primero que el soporte de $(X,Y)$ es $0 < y < x < 12$ . Entonces, como $f_{Y|X}(y|x) = x^{-1}$ y $f_{X}(x) = 12^{-1}$ podemos deducir que $f_{X,Y}(x,y) = (12x)^{-1}$ . Entonces, calcule
$$f_{Y}(y) = \int_{y}^{12} (12x)^{-1} \, dx = (1/12)[\ln(12) - \ln(y)].$$
A continuación, utilice esto para calcular
$$E[Y] = \int_{-\infty}^{\infty} y \cdot f_{Y}(y) \, dy = \int_{0}^{12} y \cdot (1/12)[\ln(12) - \ln(y)] \, dy = 3.$$
El cálculo de la última integral era... "factible" para un integrador experimentado, pero no era lo ideal.
La solución publicada fue la siguiente:
$$E[Y] = \int_{0}^{12} \int_{0}^{x} (y/12x) \, dy \, dx = 3.$$
La integral anterior es mucho más fácil de resolver, así que una vez que entienda que es una forma válida de calcular la expectativa, la añadiré con gusto a mi cinturón de herramientas para resolver problemas. Pero, de nuevo, no veo cómo se ajusta a la definición de expectativa, porque no veo cómo está recuperando la distribución marginal para $Y$ . A no ser que, haciéndolo así, se utilice la identidad que menciono en el bloque central del texto.
Entonces, ¿por qué es válido el otro método?