Mi pregunta tiene que ver con el ajuste de distribuciones en datos censurados; a efectos de claridad, podemos considerar una distribución continua que está censurada tanto a la izquierda como a la derecha. En tal caso, las variantes se "agrupan" en un valor superior máximo si son mayores que un umbral $t_h$ o en un valor mínimo inferior si son inferiores a un umbral $t_l$ . Sólo hemos observado estos datos censurados y queremos ajustar una distribución que en algún sentido modele adecuadamente los datos que hemos observado.
He visto varios casos de ajuste de distribuciones en los que el ajuste de los parámetros se realiza mediante la estimación de máxima verosimilitud. En estos casos, la probabilidad de los puntos censurados se establece a través de la FDA F(x) = P(X < x): $F(x)$ se utiliza para evaluar los puntos truncados por la izquierda y $1-F(x)$ se utiliza para evaluar los puntos truncados por la derecha. Mientras tanto, para los puntos no truncados, se utiliza la densidad de probabilidad f(x) para la evaluación. Para algunos ejemplos, por favor vea estos posts si no entiende lo que quiero decir:
https://www.r-bloggers.com/fitting-censored-log-normal-data/
Mi pregunta es, ¿por qué es comúnmente aceptado ajustar las partes censuradas utilizando la probabilidad $mass$ pero las partes no censuradas utilizando la probabilidad $density$ ? Al tratarse de unidades diferentes, ¿no se vuelven inestables los resultados o se ven influenciados por las diferencias de escalas de magnitud que puedan existir entre la densidad y la masa?
Mi racionalización de por qué este procedimiento puede ser Lo que está bien es que, en un régimen de selección de modelos como el ajuste de distribuciones, estos problemas persisten en varios parámetros de la clase de modelos; en cierto sentido, tenemos una "igualdad de condiciones" entre las distribuciones contendientes. Esto no resuelve realmente el problema de las diferentes escalas de masa y densidad, pero al menos parece "justo".
¿Podría alguien arrojar algo de luz sobre esto? Cualquier otra indicación sobre cómo tratar este tipo de distribuciones (continuas sobre un rango, y luego con masas puntuales) sería útil ya que soy muy nuevo en este espacio.
Gracias de antemano.