4 votos

Estimación del parámetro lambda en la distribución exponencial

enter image description here

Estoy leyendo lo siguiente de la página 60 de Teoría de la información y aprendizaje automático. Mis preguntas son las siguientes

  1. En el supuesto de que $\lambda \ll 20$ ¿por qué $\bar{x}-1$ un buen estimador, ¿podría alguien añadir el detalle que lo explica?
  2. ¿Qué tipo de técnicas de binning ad hoc funcionarían para $\lambda\gg20$ ?

Sé que el autor se limita a introducir su proceso de pensamiento para que el supervisor le lleve finalmente a una forma bayesiana de pensar, pero me interesa saber por qué su lógica para estos casos concretos funciona aunque la solución no sea unificadora. Gracias.

0 votos

He cambiado $\lambda<<20$ y $\lambda>>20$ a $\lambda \ll 20$ y $\lambda \gg 20.$ Esto es lo habitual y coincide con la notación utilizada en el texto citado.

0 votos

Esto parece ser un tipo inusual de censura/truncamiento en el que nunca se sabe de la existencia de realizaciones fuera de la 'ventana' $(1,20).$ Puede que le interese leer más sobre la censura de "tipo 1" y "tipo II". Una discusión elemental .

2voto

Si $\lambda$ es pequeño por lo que $\mathbb P(X \ge 20) \approx 0$ se puede decir $$\mathbb E[X \mid 1 \lt X \lt 20] \approx \mathbb E[X \mid 1 \lt X ] = \lambda +1$$ por la propiedad sin memoria de la distribución exponencial, y eso puede sugerir $\hat{\lambda} = \overline{x}-1$ como estimador utilizando estos datos truncados

En general $$\mathbb E[X \mid 1 \lt X \lt 20] = \dfrac{\int_1^{20} \frac{x}{\lambda} e^{-x / \lambda} dx}{\int_1^{20} \frac{1}{\lambda} e^{-x / \lambda} dx}= \lambda + 1 -\dfrac{19}{e^{19/\lambda}-1}$$
que para los muy grandes $\lambda$ está cerca de $\dfrac{21}{2} - \dfrac{361}{12\lambda}$ por lo que podría sugerir algo como $\hat{\lambda} = \dfrac{361}{126 - 12\overline{x}}$ como un posible estimador aproximado utilizando estos datos truncados, aunque señalando que esto producirá un sinsentido en los casos en los que $\overline{x}\ge 10.5$

Como ilustración del binning: si observa $Y$ longitudes en un intervalo entre $1$ y $10.5$ y $Z$ en un contenedor de $10.5$ a $20$ entonces $\mathbb{E}[Y] = e^{19/(2\lambda)}\mathbb{E}[Z]$ por lo que un posible estimador de $\lambda$ es $\hat{\lambda} = \dfrac{19}{2(\log_e(Y) - \log_e(Z))}$ aunque esto no tendrá sentido si $Y=0$ o $Z=0$ o $Y \le Z$

Se pueden evitar estos riesgos de sinsentido con una priorización bayesiana adecuada, aunque las observaciones que de otro modo podrían conducir a sinsentidos probablemente den distribuciones posteriores restringidas por esa priorización y, en particular, cualquier límite superior a priori sobre $\lambda$

0 votos

Eso tiene mucho sentido, gracias, ¿cómo lo conseguiste? $\mathbb{E}(Y)=e^{19/(2\lambda)} \mathbb{E}(Z)$ ?

0 votos

@Iltl Esencialmente estás comparando $\mathbb{P}(1 \lt X \lt 10.5) = \int_1^{10.5} \frac{1}{\lambda}e^{-x/\lambda}dx$ con $\mathbb{P}(10.5 \lt X \lt 21) = \int_{10.5}^{21} \frac{1}{\lambda}e^{-x/\lambda}dx$ y este último es $e^{-9.5/\lambda}$ veces el anterior

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X