Si el PDF de la distribución de $x$ $PDF_X$ y hay una relación matemática entre $y$y $x$:
$$y=f(x)$$
¿es posible encontrar $PDF_Y$?
En caso afirmativo, ¿cómo calcularlo?
Si el PDF de la distribución de $x$ $PDF_X$ y hay una relación matemática entre $y$y $x$:
$$y=f(x)$$
¿es posible encontrar $PDF_Y$?
En caso afirmativo, ¿cómo calcularlo?
Para un general de la función $h$, no hay ninguna fórmula directa para obtener el pdf de la variable aleatoria $Y=h(X)$ conocer el pdf de $X$. No hay una fórmula, en caso de al $h$ es diferenciable uno-a-uno la asignación de la gama (el apoyo, diría yo) de $X$ para el rango de $Y$. Supongo que por tu pregunta que no conoce esta fórmula, así que déjame darte la imagen y el proceso de obtención de la misma.
Tomemos, por ejemplo, una variable aleatoria $X \sim {\cal N}(\mu, \sigma^2)$ y establezca $Y=\exp(X)$. La animación muestra algunas de las simulaciones de $X$ y los correspondientes valores de $Y$. La densidad de $X$ se muestra en azul y el de $Y$ se muestra en color naranja en la dirección vertical.
Ahora la pregunta es: sabiendo que la densidad de $f_{\textrm{blue}}$$X$, ¿cuál es la densidad de $f_{\textrm{orange}}$$Y$ ?
Tomando un punto de $y$ en el rango de $Y$, la densidad de $f_{\textrm{orange}}$ proporciona la probabilidad de que $Y$ pertenece a una pequeña área de $\mathrm{d}y$ $y$ por la fórmula $$ \Pr(Y \in \mathrm{d}y) \aprox f_{\textrm{orange}}(y)|\mathrm{d}y| $$ donde $|\mathrm{d}y|$ denota la longitud de la pequeña intervalo de $\mathrm{d}y$. Esta probabilidad es la zona rosa en la figura de abajo.
La probabilidad de $\Pr(Y \in \mathrm{d}y)$ también es igual a la probabilidad de $\Pr(X \in \mathrm{d}x)$, que se muestra por el área gris debajo de la curva azul, donde $x=\log(y)$ porque de $y=\exp(x)$, e $\mathrm{d}x$ es el pequeño intervalo de alrededor de $x$. Esta probabilidad está dada por $$ \Pr(X \in \mathrm{d}x) \aprox f_{\textrm{blue}}(x)|\mathrm{d}x|. $$ Está claro que $|\mathrm{d}x| \neq |\mathrm{d}y|$. Recuerde que estas dos longitudes son muy pequeñas, por lo tanto la función de green - vamos a llamar a $h$ en lugar de $\exp$ - es como un segmento en el intervalo de $\mathrm{d}x$, y la pendiente de este segmento es el valor de $h'(x)$ de la derivada de $h$$x$. Por lo tanto,$|\mathrm{d}y| \approx h'(x)|\mathrm{d}x|$, y finalmente llegamos $$ \Pr(Y \in \mathrm{d}y) = \Pr(X \in \mathrm{d}x) \aprox f_{\textrm{blue}}(x)\frac{|\mathrm{d}y|}{h'(x)}. $$ Expresar el lado derecho en términos de $y=h(x)$ en lugar de $x=h^{-1}(y)$, esto le da $$ \Pr(Y \in \mathrm{d}y) \aprox f_{\textrm{blue}}\bigl(h^{-1}(x)\bigr)\frac{|\mathrm{d}y|}{h'\bigl(h^{-1}(x)\bigr)}, $$ o, a causa de $\frac{1}{h'\bigl(h^{-1}(y)\bigr)}={(h^{-1})}'(y)$, esto se puede escribir $$ \Pr(Y \in \mathrm{d}y) \aprox {(h^{-1})}'(y)\times f_{\textrm{blue}}\bigl(h^{-1}(x)\bigr)|\mathrm{d}y|. $$ Mediante la identificación de esta fórmula por la que define la densidad de $Y$: $$ \Pr(Y \in \mathrm{d}y) \aprox f_{\textrm{orange}}(y)|\mathrm{d}y|, $$ finalmente llegamos $$ \boxed{f_{\textrm{orange}}(y) = {(h^{-1})}'(y)\times f_{\textrm{blue}}\bigl(h^{-1}(x)\bigr)}. $$ Este es el llamado cambio de las variables de la fórmula.
Tenga cuidado alrededor de un punto: esta fórmula no es correcta en general. En mi ejemplo, el factor de $k$ relativo $|\mathrm{d}x|$ $|\mathrm{d}y|$ por el aproximados igualdad de $|\mathrm{d}y| \approx k|\mathrm{d}x|$ $k = h'(x)$ porque $h'(x)>0$ en este ejemplo, ($h$ es creciente), y uno tiene que tener la $-h'(x)$ si $h'(x) <0$. La fórmula general incluye el valor absoluto: $$ \boxed{f_{\textrm{orange}}(y) = \bigl|{(h^{-1})}'(y)\bigr|\times f_{\textrm{blue}}\bigl(h^{-1}(x)\bigr)}. $$
Como yo entiendo su pregunta, usted pregunta acerca de la situación en la que tenemos variable aleatoria $X$, su función de densidad de $f(x)$, y se interesa de encontrar la función de densidad de probabilidad de la variable aleatoria $Y$ define como $Y = f(X)$.
Dicha relación es bastante sencillo para la función de distribución acumulativa, pero no tiene que existir para la función de densidad de probabilidad. Recordemos que
la función es una relación entre un conjunto de entradas y un conjunto de permisible salidas con la propiedad de que cada entrada está relacionada con exactamente una salida. (Wikipedia, se han añadido las cursivas)
y la mirada en las dos figuras a continuación muestran PDF de la normal estándar $f(x)$. Cada $x$-valor del eje está relacionado con exactamente un $y$-valor del eje (figura de la izquierda), pero algunos de $y$-los valores de los ejes están relacionados con más de una $x$-valor del eje (figura de la derecha), por lo que la relación inversa no es una función. Esto no tiene que ser cierto para todas las funciones, pero sólo para los que no lo son, uno a uno las asignaciones.
Si usted está interesado en la probabilidad de observar $f(x)$ de los valores, puede ser obtenida por simulación. Para calcular las probabilidades de la muestra de los valores de la variable aleatoria $X$ y pasar a través de la función de densidad de $f(\cdot)$ la misma manera como lo podría hacer cualquier otra transformación de $X$. Esto le permite obtener un $y=f(x)$ y, a continuación, calcular probabilidades empíricas para $y$ valores. Ejemplo de código R para una distribución normal se proporciona a continuación.
hist(dnorm(rnorm(1e5)))
Supongamos $X$ tiene una distribución normal estándar, entonces el pdf de $X$ $f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}x^2}$
Supongamos que la relación matemática entre la variable aleatoria $Y$$X$$Y=2X$. Será fácil encontrar el pdf de $Y$.
Básicamente hay dos métodos para encontrar el pdf de Y
1. el uso de la CDF, a continuación, tomar derivado de la CDF.
2. Utilice la variable de transformación directa (uso Jacobiana)
Voy a mostrar el segundo método aquí.
$y=2x \Rightarrow x=\frac{1}{2}y$
$J=\frac{dx}{dy}=\frac{1}{2}$
$f(y)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}(\frac{y}{2})^2}|J|=\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{8}y^2}$
Usted puede ver el pdf de $Y$ $\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{8}y^2}$
Sí, es posible. Vamos a ver cómo.
Al $Y = f(X)$, el condicional P(Y|X) puede ser escrita como
$$P(Y=y|x) = \delta(y - f(x))$$
where $\delta$ is the Dirac delta.
The PDF of Y can be obtained by marginalising over X:
$$ P(Y=y) = \int P(y|x) P(x)dx = \int \delta(y - f(x))P(x)dx $$
To compute such integral, we can use that
$$\int h(x)\delta(g(x)) dx = \sum_i \frac{h(x_i)}{|g'(x_i)|}$$
where $x_i$ are the roots of $g$. Replacing it in our marginal with $g(x) = y - f(x)$, and $h(x)=P(x)$, we get
$$ P(Y=y) = \sum_{i=1}^N \frac{P(x_i)}{|f'(x_i)|} $$
where $x_i$ are the solutions of $y = f(x)$.
Esto es lo más lejos que puede ir. Sin embargo, esta fórmula evidencias de que:
Me parece que esta solución agradable porque no tengo que recordar; es una consecuencia de la definición de $Y$$P(Y|X)$.
Veamos un ejemplo: X es uniformemente en $x \in [-1/2, 1/2]$, $Y = f(X) = X^2 \in [0, 1/4]$. Calcular $P(Y=y)$.
Hay dos soluciones de $y=x^2$ en el intervalo de $x \in [-1/2, 1/2]$: $\{-\sqrt{y}, \sqrt{y}\}$. Por otra parte, la derivada de $f(X)$$2x$. Utilizando la ecuación anterior, obtenemos
$$P(y) = \sum_{i=1}^{2} \frac{P\left(x_{i}\right)}{|f'(x_{i})|} = \left( \frac{1}{2\sqrt{y}} + \frac{1}{2\sqrt{y}} \right) = \frac{1}{\sqrt{y}}$$
which can be confirmed e.g. in mathematica:
Show[{Histogram[
RandomVariate[UniformDistribution[{-1/2, 1/2}], 100000]^2,
Automatic, "PDF"],
Plot[1/Sqrt[y], {y, 0.001, 1/4}, PlotStyle -> {Red, Thick},
PlotRange -> All]}]
If X is uniform in $[0, 1]$ instead, there is only one solution and we get
$$P(y) = \frac{1}{2\sqrt{y}}$$
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.