22 votos

¿Por qué la media del logaritmo natural de una distribución uniforme (entre 0 y 1) es diferente del logaritmo natural de 0,5?

Para una variable uniformemente distribuida entre 0 y 1 generada mediante

rand(1,10000)

esto devuelve 10.000 números aleatorios entre 0 y 1. Si se toma la media, es 0,5, mientras que si se toma el logaritmo de esa muestra, entonces se toma la media del resultado:

mean(log(rand(1,10000)))

Yo esperaría que el resultado fuera $\log 0.5=-.6931$ pero la respuesta es -1. ¿Por qué?

55voto

Lev Puntos 2212

Esta es otra ilustración de La desigualdad de Jensen $$\mathbb E[\log X] < \log \mathbb E[X]$$ (ya que la función $x\mapsto \log(x)$ es estrictamente cóncava] y de la (anti)propiedad más general de que la expectativa de la transformación no es la transformación de la expectativa cuando la transformación no es lineal (además de algunos casos exóticos). (Sin embargo, la mayoría de mis estudiantes universitarios creen firmemente en la identidad mágica $\mathbb E[h(X)] = h(\mathbb E[X])$ a juzgar por la frecuencia con que esta igualdad aparece en sus exámenes finales).

54voto

AdamSane Puntos 1825

Consideremos dos valores simétricamente situados alrededor de $0.5$ - como $0.4$ et $0.6$ o $0.25$ et $0.75$ . Sus registros son no simétrico alrededor de $\log(0.5)$ . $\log(0.5-\epsilon)$ está más lejos de $\log(0.5)$ que $\log(0.5+\epsilon)$ es. Así que cuando los promedias obtienes algo menos que $\log(0.5)$ .

Del mismo modo, si se toma un intervalo pequeño alrededor de una colección de pares de valores simétricos, se obtiene la media de los logaritmos de cada par por debajo de $\log(0.5)$ ... y es muy sencillo pasar de esa observación a la definición de la expectativa del tronco.

De hecho, normalmente, $E(t(X))\neq t(E(X))$ a menos que $t$ es lineal.

12voto

heropup Puntos 2278

Cabe señalar que si $X \sim \operatorname{Uniform}(0,1)$ entonces $-\log X \sim \operatorname{Exponential}(\lambda = 1)$ de modo que $\operatorname{E}[\log X] = -1$ . Explícitamente, $$f_X(x) = \mathbb 1(0 < x < 1) = \begin{cases} 1, & 0 < x < 1 \\ 0, & \text{otherwise} \end{cases}$$ implica $$Y = g(X) = -\log X$$ tiene densidad $$\begin{align*} f_Y(y) &= f_X(g^{-1}(y)) \left|\frac{dg^{-1}}{dy}\right| \\ &= \mathbb 1 \left( 0 < e^{-y} < 1 \right) \left| - e^{-y} \right| \\ &= e^{-y} \mathbb 1 (0 < y < \infty) \\ &= \begin{cases} e^{-y}, & y > 0 \\ 0, & \text{otherwise}. \end{cases} \end{align*}$$ Así $Y \sim \operatorname{Exponential}(\lambda = 1)$ y su media es $1$ . Esto proporciona un método muy conveniente para generar variables aleatorias con distribución exponencial mediante la transformación logarítmica de una variable aleatoria uniforme en $(0,1)$ .

6voto

Danny Whitt Puntos 111

Obsérvese que la media de una variable uniforme transformada no es más que el valor medio de la función que realiza la transformación sobre el dominio (ya que esperamos que cada valor se seleccione por igual). Esto es simplemente,

$$ \frac{1}{b-a}\int_a^b{t(x)}dx = \int_0^1{t(x)}dx $$

Por ejemplo (en R):

$$ \int_0^1{log(x)}dx = (1\cdot log(1)-1) - 0 = 0-1 =-1 $$

mean(log(runif(1e6)))
[1] -1.000016
integrate(function(x) log(x), 0, 1)
-1 with absolute error < 1.1e-15

$$ \int_0^1{x^2}dx = \frac{1}{3}(1^3-0^3) = \frac{1}{3} $$

mean(runif(1e6)^2)
[1] 0.3334427
integrate(function(x) (x)^2, 0, 1)
0.3333333 with absolute error < 3.7e-15

$$ \int_0^1{e^x}dx = e^1-e^0 = e-1 $$

mean(exp(runif(1e6)))
[1] 1.718425
integrate(function(x) exp(x), 0, 1)
1.718282 with absolute error < 1.9e-14
exp(1)-1
[1] 1.718282

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X