Supongamos que hay un pescador en el lago, que lanza repetidamente su sedal en busca de peces. Dejemos que $X_k$ denotar el tiempo que tarda en pescar un pez en su $k$ elenco, $k \in \mathbb{N}$ donde el $X_k$ son iid, muestreados a partir de alguna función de distribución $F$ y para que eso $X_k > 0$ y $\mathbb{E}X < \infty$ . El pescador sabe $F$ y tiene control sobre una cosa: puede elegir volver a lanzar su línea en cualquier momento. ¿Cuál es su estrategia óptima para capturar el mayor número de peces a largo plazo?
Hay situaciones en las que es ventajoso volver a fundir: si $F$ es bimodal, con las dos modalidades muy separadas, entonces el pescador esperará a que pase la primera modalidad y, si no ha capturado ningún pez, volverá a lanzar la línea en lugar de esperar a llegar a la siguiente modalidad.
Puedo caracterizar las funciones de distribución en las que a veces es ventajoso volver a lanzar mediante un cálculo directo, aunque tengo curiosidad por saber si existe una condición más elegante. Si el pescador no ha visto un pez hasta el momento $t$ entonces su tiempo de espera esperado para ver un pez es
\begin{equation} \mathbb{E}[X - t | X > t] = \int_{t}^\infty \frac{F(s)}{F(t)} ds, \end{equation}
donde estoy usando $F(x) = \mathbb{P}(X > x)$ . Por otro lado, el tiempo de espera incondicional esperado es
\begin{equation} \mu = \mathbb{E}[X] = \int_0^\infty F(s) ds. \end{equation}
Por lo tanto, es ventajoso volver a fundir nuestra línea en el momento $t$ si el tiempo de espera condicional esperado es mayor que el tiempo de espera incondicional, es decir, cualquier tiempo $t > 0$ Satisfaciendo a
\begin{equation} F(t) \int_0^\infty F(s) ds < \int_t^\infty F(s) ds. \end{equation}
$\Big($ EDITAR 2 : @DaneiWeissman señaló que esta condición no siempre es la correcta para averiguar la estrategia óptima. Suponiendo que la estrategia correcta es elegir un tiempo $t$ y siempre se refunden en ese momento, el tiempo de espera para esa estrategia es
\begin{equation} \mathbb{E}[X|X \leq t] + \sum_{j \geq 0} F(t)^j(1-F(t)) jt = \frac{1}{1-F(t)} \int_0^t (F(s) - F(t)) ds + \frac{t F(t)}{1-F(t)} \end{equation}
\begin{equation} =\frac{1}{1-F(t)}\int_0^t F(s)ds. \end{equation}
Esto se debe a que esperamos un número geométricamente distribuido de veces con probabilidad de fallo $F(t)$ antes de que haya un pez en $[0,t]$ y una vez que esto ocurre, lleva tiempo $\mathbb{E}[X|X \leq t]$ para atraparlo en promedio. Por lo tanto, deberíamos tratar de resolver
\begin{equation} \frac{1}{F(t)} \int_t^\infty F(s) ds = \frac{1}{1-F(t)} \int_0^t F(s) ds, \hspace{5pt} (\star \star)\end{equation}
o tal vez sólo minimizar el RHS sobre $t \in \mathbb{R}$ . $\Big)$
Por ejemplo, si estas expresiones son iguales para todo $t$ y diferenciando con respecto a $t$ produce
\begin{equation} \mu F'(t) = -F(t), \end{equation}
y $F(t) = e^{-t/\mu}$ es la única función de distribución en $[0,\infty)$ que satisface esta EDO. Por lo tanto, si el $X$ 's son exponenciales entonces volver a fundir en cualquier momento nunca nos perjudica ni nos ayuda. ( Esto no debería sorprender a nadie que esté familiarizado con los procesos de Poisson y la propiedad sin memoria de la distribución exponencial. )
También se puede calcular directamente con $F_\alpha(x) = (1+x)^{-\alpha}$ , para $\alpha > 1$ . Esto da
\begin{equation} \mathbb{E}[X - t | X > t] = \frac{t+1}{\alpha - 1}, \end{equation}
mientras que
\begin{equation} \mathbb{E}X = \frac{1}{\alpha - 1}. \end{equation}
Así que el pescador debe volver a lanzar su línea en cada vez positivo en este caso.
Me interesan los tiempos $t$ donde tenemos la igualdad, es decir, los tiempos $t$ cuando
\begin{equation} \mathbb{E}[X-t|X > t] = \mathbb{E}[X] \hspace{10pt} (\star) \end{equation}
Mis preguntas son:
1) ¿Qué conjuntos posibles pueden darse como conjuntos solución a $(\star)$ o $(\star \star)$ ? Por ejemplo, ¿puede haber una única solución? $N$ soluciones para algunos $N \in \mathbb{N}$ ? ¿Puede satisfacerse para todos $t$ en algún intervalo?
2) ¿Existe una condición más agradable para determinar si hay o no algunos solución a $(\star$ ) o $(\star \star)$ ? (Me pregunto si hay alguna forma de comparar $F$ a una distribución exponencial que ayude).
3) ¿Pueden las ecuaciones integrales $(\star)$ o $(\star \star)$ ¿se puede reducir a una forma más manejable?
4) ¿Hay algún otro bonito clases de funciones de distribución para las que se pueden resolver explícitamente?
5) ¿Cómo se puede entender el caso en el que $\mathbb{E}X = \infty$ ? Las ecuaciones $(\star)$ y $(\star \star)$ ya no tienen sentido. ¿Debe el pescador volver a lanzar en este caso?
Además, tengo curiosidad por saber si esta cuestión se ha estudiado en algún otro contexto: ¡me parece un montaje muy natural!
P.D. Hay muchas variantes posibles de la pregunta original. Me pregunto qué pasaría si se impusiera un coste temporal a la hora de volver a lanzar el sedal, o si el pescador no supiera cuánto tiempo ha pasado desde que lanzó su sedal. ¿Cuál sería la estrategia óptima?
EDITAR 1: Otra distribución sobre la que se puede probar algo es $F(t) = e^{-t^2}$ que decae más rápido que exponencialmente. Tenemos $\mathbb{E}X = \frac{\sqrt{\pi}}{2}$ , mientras que
\begin{equation} \mathbb{E}[X-t | X > t] = e^{t^2} \int_{t}^\infty e^{-s^2} ds. \end{equation}
Es sencillo comprobar que esta función es estrictamente decreciente, y
\begin{equation} \lim_{t \to 0^+} \mathbb{E}[X-t | X > t] = \mathbb{E}X, \end{equation}
que se mantiene para cualquier función de distribución $F$ (ya que $F$ tiene límites correctos y $F(0) = 1$ ). Por lo tanto, en este caso el pescador no debe volver a lanzar su sedal.
0 votos
¿Cuál sería el tiempo de espera esperado para la distribución en la que el pescador captura el pescado en algún momento $t_0$ con probabilidad $1/2$ y nunca de otra manera?
0 votos
@Peter Esa distribución tiene probabilidad positiva de ser infinita, así que por supuesto el tiempo de espera esperado es infinito (cualquiera de las expectativas condicionales son también infinitas por la misma razón). El pescador, obviamente, se limitará a esperar hasta el tiempo $t_0$ y reiniciar si no consigue un pez. Las distribuciones con masa en el infinito caen en el "qué pasa si ". $EX = \infty$ ", me parece que todavía debería haber una estrategia interesante en este caso.
0 votos
Se trata de un parámetro bien conocido en ingeniería de la fiabilidad, llamado MTBF (tiempo medio entre peces). De acuerdo, no pude ayudarme a mí mismo, ellos lo llaman fallo en su lugar, y tratan de maximizarlo mientras tú lo minimizas, pero las matemáticas son similares.
0 votos
¡@MikeY genial! Estaba pensando en ello, y me parece que los problemas de maximización y minimización son similares pero no equivalentes. Lo investigaré -- ¿conoces algún tratamiento del MTBF desde una perspectiva teórica?
0 votos
Creo que hay un error en la conclusión del ejemplo de $F(t) = e^{-t^2}$ . En este caso, la función de riesgo es estrictamente creciente, por lo que creo que el pescador debería nunca refundido, en lugar de siempre refundido como se indica.
0 votos
@DanielWeissman Gracias, el error ha sido corregido. También lo tenía al revés para la distribución con decaimiento polinómico $F_\alpha$ .
0 votos
No creo que $\mathbb E[Xt|X>t]> \mathbb E[X]$ es la condición correcta para querer refundir. No es necesario, porque el pescador tiene la opción de volver a lanzar una segunda vez, por ejemplo, si la función de peligro $h(t)$ viene dada por $h(t<0.01)=2$ , $h(0.01<t<100)=0$ , $h(t>100)=1$ , entonces en $t=100$ tenemos $\mathbb E[Xt|X>t]<\mathbb E[X]$ pero el pescador debería volver a lanzar. No es suficiente, ya que el pescador podría volver a lanzar más tarde, por ejemplo, si $h$ es $h(t<100)=1$ , $h(100<t<100.01)=2$ , $h(t>100.01)=0.01$ , entonces en $t=100$ tenemos $\mathbb E[Xt|X>t]>\mathbb E[X]$ pero no debería refundirse todavía.
0 votos
@DanielWeissman No estoy seguro de entender tu ejemplo. ¿Por qué esa función de riesgo implica que es mejor refundir a t=100? (¿Y cómo sabes que esa función de riesgo se da realmente como la función de riesgo para alguna distribución F?)
0 votos
@JRichey En el primer caso, siempre debe refundir en cualquier $t>0.01$ . Si adopta la regla de refundir siempre en $t=0.01$ mantiene el tiempo esperado entre capturas a $1/2$ , lo cual es óptimo. Segunda pregunta: se puede construir $F$ de $h$ : $F(t) = \exp[-\int_0^t dt' h(t')]$ .
0 votos
Creo que entiendo tu punto de vista. Es un error comparar el tiempo de espera condicional esperado con $\mathbb{E}[X|X>t]$ en $t=100$ en el primer ejemplo, porque no vamos a esperar $\mathbb{E}X$ : estamos utilizando esta estrategia en la que volvemos a fundir repetidamente en $t=.01$ por lo que deberíamos comparar con el tiempo previsto para esa estrategia.
0 votos
Esto tiene algunas similitudes con el efecto Zenón cuántico. Si la refundición/medición restablece la probabilidad del evento, podemos cambiar la probabilidad de que ocurra después $t$ mediante frecuentes refundiciones. Por ejemplo, si la probabilidad de captura después de $t$ es $\sin^2t/\tau$ , podrías refundir cada $T$ unidades de tiempo para obtener $\sin^{2t/T}T/\tau$ que se acerca a $0$ si se repone con la suficiente frecuencia. También está relacionado con la forma en que las series de polarizadores (como el LCD) giran la polarización y no absorben casi nada - los lagers del LCD son los refundidos y perder (absorber) un fotón sería la trampa.
0 votos
@JRichey $(\star\star)$ no es del todo correcto: el término $tF(t)/(1-F(t))$ no debería estar ahí. Esto se debe a que $\mathbb E[X|X<t] \ne \int_0^t ds F(s)/(1-F(t))$ . Hay un término extra en la integración por partes porque $F(t) \ne 0$ que cancela exactamente el extra $tF(t)/(1-F(t))$ . Incluso corrigiendo esto, no estoy seguro de que la ecuación sea correcta. Creo que sería mejor decir simplemente que estamos tratando de encontrar el valor(es) de $t$ que minimiza(n) $\int_0^t ds F(s)/(1-F(t))$ .
0 votos
@DanielWeissman Debes tener razón, porque la distribución exponencial no satisface $(\star \star)$ , lo cual creo que debería ser así. Pero no sé a qué te refieres ¿qué integración por partes? Sólo estoy usando $\mathbb{P}(X > s | X < t) = \mathbb{P}(X>s) 1{s < t} / \mathbb{P}(X < t),$ así que $\mathbb{E}[X | X < t] = \int_0^t \mathbb{P}(X >s)/\mathbb{P}(X < t) ds.$ Estoy de acuerdo en que minimizar eso produce la estrategia óptima: esto es, de hecho, mucho más sencillo.
0 votos
Estaba haciendo una tontería: $\mathbb{P}(t > X > s) = F(s) - F(t)$ no $F(s) 1\{s < t\}$ . Esto se ha arreglado.