Podemos decir nada acerca de la dependencia de una variable aleatoria y una función de una variable aleatoria? Por ejemplo, es $X^2$ depende de $X$?
Respuestas
¿Demasiados anuncios?Lema: Vamos a $X$ ser una variable aleatoria y deje $f$ a (Borel medible) función tal que $X$ $f(X)$ son independientes. A continuación, $f(X)$ es constante casi seguramente. Es decir, hay algo de $a \in \mathbb R$ tal que $\mathbb P(f(X) = a) = 1$.
La prueba es la siguiente; pero, en primer lugar, hacer algunas observaciones. El Borel mensurabilidad es sólo una condición técnica para garantizar que podemos asignar probabilidades en un plazo razonable y de forma coherente. El "casi seguramente" la declaración es sólo un tecnicismo.
La esencia de la lema es que si queremos $X$ $f(X)$ a ser independiente, entonces nuestro único de los candidatos son funciones de la forma $f(x) = a$.
Esto contrasta con el caso de funciones de $f$ tal que $X$ $f(X)$ son no correlacionados. Esto es mucho, mucho más débil condición. En efecto, considere la posibilidad de cualquier variable aleatoria $X$, con una media de cero, finito absoluta tercer momento y que es simétrica alrededor de cero. Tome $f(x) = x^2$, como en el ejemplo de la pregunta. A continuación,$\mathrm{Cov}(X,f(X)) = \mathbb E Xf(X) = \mathbb E X^3 = 0$, lo $X$ $f(X) = X^2$ no están correlacionados.
A continuación, doy la más sencilla prueba que se me podía venir por el lema. Me he hecho muy detallado para que todos los detalles son tan obvias como sea posible. Si alguien ve las maneras de mejorar o simplificar, me gustaría saber.
La Idea de la prueba: Intuitivamente, si conocemos $X$, entonces sabemos $f(X)$. Por lo tanto, necesitamos encontrar algún evento en $\sigma(X)$, el sigma álgebra generada por $X$, que se refiere a nuestro conocimiento de $X$ a de $f(X)$. Entonces, podemos usar esa información junto con la supuesta independencia de $X$ $f(X)$ a demostrar que nuestras opciones disponibles para $f$ han sido muy limitadas.
La prueba del lema: Recordar que $X$ $Y$ son independientes si y sólo si para todos los $A \in \sigma(X)$ y $B \in \sigma(Y)$, $\renewcommand{\Pr}{\mathbb P}\Pr(X \in A, Y \in B) = \Pr(X \in A) \Pr(Y \in B)$. Deje $Y = f(X)$ para algunos Borel medible función de $f$ tal que $X$ $Y$ son independientes. Definir $\newcommand{\o}{\omega}A(y) = \{\o: f(X(\o)) \leq y\}$. A continuación, $$ Un(y) = \{\s: X(\s) \in f^{-1}((-\infty,y])\} $$ y desde $(-\infty,y]$ es un conjunto de Borel y $f$ es Borel medible, a continuación, $f^{-1}((-\infty,y])$ también es un conjunto de Borel. Esto implica que $A(y) \in \sigma(X)$ (por definición(!) de $\sigma(X)$).
Desde $X$ $Y$ se supone que son independientes y $A(y) \in \sigma(X)$, luego $$ \Pr(X \in A(y), Y \leq y) = \Pr(X \in A(y)) \Pr(Y \leq y) = \Pr(f(X) \leq y) \Pr(f(X) \leq y) \>, $$ y esto vale para todos los $y \in \mathbb R$. Pero, por definición, de $A(y)$ $$ \Pr(X \in A(y), Y \leq y) = \Pr(f(X) \leq y, y \leq y) = \Pr(f(X) \leq y) \> . $$ La combinación de estos dos últimos, obtenemos que para cada$y \in \mathbb R$, $$ \Pr(f(X) \leq y) = \Pr(f(X) \leq y) \Pr(f(X) \leq y) \>, $$ por lo $\Pr(f(X) \leq y) = 0$ o $\Pr(f(X) \leq y) = 1$. Esto significa que debe haber alguna constante $a \in \mathbb R$ de manera tal que la función de distribución de $f(X)$ saltos de cero a uno, en $a$. En otras palabras, $f(X) = a$ casi seguramente.
NOTA: tenga en cuenta que el contrario también es cierto incluso más simple argumento. Es decir, si $f(X) = a$ casi seguramente, a continuación, $X$ $f(X)$ son independientes.
Aquí es una prueba de @cardenal comentario con un pequeño giro. Si $X$ $f(X)$ son independientes, a continuación, $$ \begin{array}{lcl} P(X \in A \cap f^{-1}(B)) & = & P(X \in A, f(X) \in B) \\ & = & P(X \in A) P(f(X) \in B) \\ & = & P(X \in A) P(X \in f^{-1}(B)) \end{array} $$ Tomando $A = f^{-1}(B)$ los rendimientos de la ecuación $$P(f(X) \in B) = P(f(X) \in B)^2,$$ que tiene las dos soluciones de 0 y 1. Por lo tanto $P(f(X) \in B) \in \{0, 1\}$ todos los $B$. En total generalidad, no es posible decir más. Si $X$ $f(X)$ son independientes, entonces la $f(X)$ es una variable tal que para cualquier $B$ es o $B$ o en $B^c$ con una probabilidad de 1. Para decir más, una de las necesidades más suposiciones, por ejemplo, que singleton conjuntos de $\{b\}$ son medibles.
Sin embargo, los detalles en la medida teórica de nivel no parecen ser la principal preocupación de la OP. Si $X$ es real y $f$ es una función real (y usamos el Borel $\sigma$-álgebra, por ejemplo), y luego tomar las $B = (-\infty, b]$ se sigue que la función de distribución para la distribución de $f(X)$ sólo toma los valores 0 y 1, por lo tanto hay un $b$ a la que salta de $0$$1$$P(f(X) = b) = 1$.
Al final del día, la respuesta a la OPs pregunta es que $X$ $f(X)$ son generalmente dependiente e independiente sólo en circunstancias muy especiales. Por otra parte, la medida de Dirac $\delta_{f(x)}$ siempre califica para una distribución condicional de $f(X)$$X = x$, que es una manera formal de decir que el conocer a $X = x$, entonces usted también sabe exactamente lo $f(X)$ es. Esta forma especial de dependencia con un degenerado condicional de distribución es característica de las funciones de variables aleatorias.