3 votos

¿Hay alguna manera de encontrar $\min\{m(|X-c|), \:c \in \mathbb{R}\}$ ?

Supongamos que X es una variable aleatoria, tal que $F(t) := P(X < t) \in C(\mathbb{R})$ . ¿Hay alguna manera de encontrar $\min\{m(|X-c|), c \in \mathbb{R}\}$ ? Aquí $m$ es la mediana.

Conozco las soluciones para dos casos particulares: (y ambos utilizan un método similar):

Si $X \sim U[a, b]$ entonces $$P(|X - c| < t) = P(c - t < X < c + t) = \begin{cases} 0 & \quad \text{if } c + t < a\\ 0 & \quad \text{if } c - t > b\\ \frac{2t}{b - a} & \quad \text{if } a < c - t < c + t < b\\ \frac{c + t - a}{b - a} & \quad \text{if } c - t < a < c + t < b\\ 1 & \quad \text{if } c - t < a < b < c + t\\ \frac{b - c + t}{b - a} & \quad \text{if } a < c - t < b < c + t \end{cases} $$ Esto da lugar a $$m(|X-c|) = \begin{cases} \frac{b + a}{2} - c & \quad \text{if } c < \frac{3a + b}{4}\\ \frac{b - a}{4} & \quad \text{if } c \in [\frac{3a + b}{4}; \frac{a+3b}{4}]\\ c - \frac{a + b}{2} & \quad \text{if } c > \frac{a+3b}{4} \end{cases}$$ Y eso significa que $\min\{m(|X-c|), \:c \in \mathbb{R}\} = \frac{b - a}{4}$ .

Si $X \sim Exp(\lambda)$ entonces $$P(|X - c| < t) = P(c - t < X < c + t) = \begin{cases} 0 & \quad \text{if } c < -t\\ 1 - e^{-\lambda(c + t))} & \quad \text{if } c \in [-t; t]\\ 2e^{-\lambda c}sinh(\lambda t) & \quad \text{if } c > t \end{cases} $$ Esto da lugar a $$m(|X-c|) = \begin{cases} \frac{\ln2}{\lambda} - c & \quad \text{if } c < \frac{\ln2}{2\lambda}\\ \frac{arsinh(\frac{e^{\lambda c}}{4})}{\lambda} & \quad \text{if } c > \frac{\ln2}{2\lambda} \end{cases}$$ Y eso significa que $\min\{m(|X-c|), \:c \in \mathbb{R}\} = \frac{\ln2}{2\lambda}$

Sin embargo, no he podido aplicar este método al caso general.

1voto

antkam Puntos 106

No es una solución completa, pero es una idea que proporciona atajos útiles (a veces).

Imagine el PDF de $X$ como una imagen. El PDF de $X-c$ es, por supuesto, sólo un cambio, y $|X-c|$ se pliega alrededor de $c$ .

¿Qué es? $median(|X-c|)$ ? Desde $|X-c|$ tiene un límite inferior definido en $0$ la mediana es sólo el punto $m>0$ donde la FCD de $|X-c|$ alcanza exactamente $P(|X-c| < m) = 1/2$ . Si se "despliega" la imagen, ésta corresponde a los puntos $-m, m$ donde:

$$P(-m < X-c < m) = 1/2 = P(c-m < X < c+m)$$

Piensa en tu optimización como si se tratara de un recorrido por todo $c, m$ pero sujeto a la restricción anterior, y su objetivo es minimizar $m$ .

Pero esto equivale a minimizar ${b-a \over 2}$ sobre todos los posibles $a,b$ valores, limitados por:

$$P(a < X < b) = 1/2 = CDF(b) - CDF(a)$$

Así que, genéricamente, puedes hacer esto: Para cada $a$ , defina $B(a)$ para ser el valor $b$ s.t. $CDF(b) - CDF(a) = 1/2$ . Entonces se encuentra el $a$ que minimiza ${B(a)-a \over 2}$ .

Sin embargo, gráficamente esta vista le da alguna posibilidad de atajos. Se trata de encontrar un rango $(a,b)$ lo más estrecho posible, que aún contiene $1/2$ de la probabilidad. Así que se mira el PDF y en muchos casos conocidos la solución es visualmente obvia. Por ejemplo

  • Para $X \sim U[a,b]$ es obvio que cualquier rango de anchura $w = {b-a \over 2}$ que es totalmente $\subset [a,b]$ lo hará. Así que su mínimo $m = {w \over 2} = {b - a \over 4}$ y en realidad tiene una opción de $c$ del 25% al 75%.

  • Para $X \sim Exp(\lambda)$ la PDF es estrictamente decreciente, por lo que el rango óptimo debe estar en la parte delantera, es decir, de la forma $(0,b)$ . También necesita $CDF(b) - CDF(0) = CDF(b) = 1/2$ Así que $b = median(X)$ . De la wikipedia :) tenemos $median(X) = {\ln 2 \over \lambda}$ , por lo que su mínimo $m = {b - 0 \over 2} = {\ln 2 \over 2 \lambda}$

  • Para cualquier $X$ cuya PDF es simétrica con respecto a su media, y que disminuye monotónicamente lejos de la media, primero se desplaza a media cero, entonces por simetría su rango óptimo es $(-z, z)$ que contiene $1/2$ de la probabilidad. Así que busca $z = CDF^{-1}(3/4)$ . En caso de $N(0,1)$ puedes buscar esto fácilmente. En el caso de un triángulo o un trapecio, hay que hacer un poco de geometría.

Muchas PDF "comunes" tienen un solo pico y decaen a ambos lados, por lo que el rango óptimo debe incluirlo. Muchas también tienen simetría. Si hay soluciones de forma cerrada dependerá de los detalles matemáticos, pero al menos ahora sabes dónde buscar. Espero que esto te sirva de ayuda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X