Estoy buscando una referencia que cubra el siguiente caso especial del problema de detección más rápida (o prueba de hipótesis secuencial). Creo que debe existir una amplia bibliografía al respecto, ya sea en finanzas matemáticas o en teoría de la decisión estadística.
Sea $\theta$ ser inobservable. El responsable de la toma de decisiones (DM) desea elegir la acción $A_1$ si $\theta>0$ y $A_2$ de lo contrario. Antes de tomar una decisión, el DM puede optar por esperar a saber más sobre $\theta$ pero esto es costoso. El DM decide cuándo dejar de aprender y elegir una acción.
Por lo tanto, se trata de un tiempo de parada óptimo de la forma \begin{align} \inf_{\tau} \mathbb{E}\left[g(\pi_{\tau}) - c\tau|\pi_0\right], \end{align} donde $\pi_t$ es la creencia del DM en el momento $t$ basándose en la información recibida por DM ( $\pi_0$ es la creencia previa) y $g(\pi)$ es el beneficio esperado de tomar una decisión cuando la creencia es $\pi$ .
Estoy buscando libros/notas (o documentos accesibles) que cubran este tipo de problemas. Estoy particularmente, interesado en el caso en que $\theta~\sim N(\mu,\sigma^2)$ y DM está observando el proceso $dY_t=\theta dt + \nu dW_t,$ con $W_t$ un movimiento browniano estándar.