Mi libro de texto tiene un muy breve sección que introduce algunos conceptos de la teoría de la medida:
Otro detalle técnico de las variables continuas se refiere a la manipulación continua de las variables aleatorias que son deterministas, las funciones de uno a otro. Supongamos que tenemos dos variables aleatorias, $\mathbf{x}$$\mathbf{y}$, de tal manera que $\mathbf{y} = g(\mathbf{x})$ donde $g$ es invertible, continua, diferenciable de la transformación. Uno podría esperar que $p_y(\mathbf{y}) = p_x(g^{−1} (\mathbf{y}))$. En realidad este no es el caso.
Como un ejemplo simple, supongamos que tenemos escalar las variables aleatorias $x$$y$. Supongamos $y = \dfrac{x}{2}$$x \sim U(0,1)$. Si utilizamos la regla de $p_y(y) = p_x(2y)$, $p_y$ $0$ en todas partes excepto en el intervalo de $\left[ 0, \dfrac{1}{2} \right]$, y va a ser $1$ en este intervalo. Esto significa
$$\int p_y(y) \ dy = \dfrac{1}{2},$$
el que viola la definición de una distribución de probabilidad. Este es un error común. El problema con este enfoque es que no tiene en cuenta la distorsión fo espacio introducidas por la función de $g$. Recordemos que la probabilidad de $\mathbf{x}$ acostado en un infinitesimalmente pequeña región con un volumen de $\delta \mathbf{x}$ está dado por $p(\mathbf{x}) \delta \mathbf{x}$. Desde $g$ puede expandir o contraer el espacio, el infinitesimal de volumen de los alrededores $\mathbf{x}$ $\mathbf{x}$ espacio puede tener diferente volumen en $\mathbf{y}$ espacio.
A ver cómo corregir el problema, volvemos a escalar caso. Tenemos que presentar la propiedad
$$| p_y(g(x)) \ dy | = | p_x (x) \ dx |$$
De problemas a partir de esto, obtenemos
$$p_y(y) = p_x(g^{-1}(y)) \left| \dfrac{\partial{x}}{\partial{y}} \right|$$
o, equivalentemente,
$$p_x(x) = p_y(g(x)) \left| \dfrac{\partial{g(x)}}{\partial{x}} \right|$$
¿Cómo consiguen $p_y(y) = p_x(g^{-1}(y)) \left| \dfrac{\partial{x}}{\partial{y}} \right|$ o, equivalentemente, $p_x(x) = p_y(g(x)) \left| \dfrac{\partial{g(x)}}{\partial{x}} \right|$ mediante la resolución de $| p_y(g(x)) \ dy | = | p_x (x) \ dx |$?
Por favor alguien puede demostrar esto y explicar los pasos?