Esta pregunta está relacionada con mi otra pregunta ( Necesito ayuda con un modelo, análisis de datos de Whatsapp ). Supongamos que tenemos variables aleatorias $X_1,\cdots,X_m$ bernoulli distribuido con probabilidad $p$ , $D_1,\cdots,D_m \sim Exp(\lambda_d)$ , $P_1,\cdots,P_m \sim Exp(\lambda_P)$ y que $d_i := X_i D_i + (1-X_i)P_i$ para $i=1,\cdots,m$ . Supongamos además que $\lambda_d >> \lambda_P$ . Entonces, ¿cómo podemos averiguar observando sólo $d_i$ para lo cual $X_i = 1$ ? En mi otra pregunta se sugirió tomar la media $\widehat{d}$ de $d_i$ y si $d_i > \widehat{d}$ entonces para deducir que $X_i = 0$ . Pero este procedimiento es más una heurística que un argumento real. ¿Alguien tiene una idea de cómo convertir esto en un argumento?
Conozco el método de Otsu en visión por ordenador para agrupar una imagen en blanco y negro. ( https://en.wikipedia.org/wiki/Otsu%27s_method ) ¿Cree que este método podría aplicarse en esta situación?
Editar: Por sugerencia de Anthony Quas, ordenaré el $d_i$ y luego busca un hueco grande. La brecha se encuentra maximizando la intersuma de cuadrados como en el método de Otsu. Aquí está el código R para encontrar el índice $I$ en el que se produce el corte:
S <- 0
I <- -1
st <- sort(di)
for(i in seq(2,m-2)){
A <- st[1:i]
B <- st[(i+1):m]
mA <- mean(A)
mB <- mean(B)
ssInter <- length(A)*(mA-mean(di))^2+length(B)*(mB-mean(di))^2
if( ssInter > S){ S <- ssInter; I <- i}
}