Tengo una función de probabilidad $ \mathcal {L}(d | \theta )$ por la probabilidad de que mis datos $d$ dados algunos parámetros del modelo $ \theta \in \mathbf {R}^N$ que me gustaría estimar. Suponiendo que los parámetros tienen una prioridad plana, la probabilidad es proporcional a la probabilidad posterior. Utilizo un método MCMC para muestrear esta probabilidad.
Observando la cadena convergente resultante, encuentro que los parámetros de máxima probabilidad no son consistentes con las distribuciones posteriores. Por ejemplo, la distribución de probabilidad posterior marginada para uno de los parámetros podría ser $ \theta_0 \sim N( \mu =0, \sigma ^2=1)$ mientras que el valor de $ \theta_0 $ en el punto de máxima probabilidad es $ \theta_0 ^{ML} \approx 4$ que es esencialmente casi el valor máximo de $ \theta_0 $ atravesado por el muestreador MCMC.
Este es un ejemplo ilustrativo, no mis resultados reales. Las distribuciones reales son mucho más complicadas, pero algunos de los parámetros ML tienen valores p igualmente improbables en sus respectivas distribuciones posteriores. Obsérvese que algunos de mis parámetros están limitados (por ejemplo $0 \leq \theta_1 \leq 1$ ); dentro de los límites, los antecedentes son siempre uniformes.
Mis preguntas son:
-
¿Es tal desviación un problema per se ? Obviamente no espero que los parámetros ML coincidan exactamente con los máximos de cada una de sus distribuciones posteriores marginales, pero intuitivamente siento que tampoco deben encontrarse en la profundidad de las colas. ¿Esta desviación invalida automáticamente mis resultados?
-
Tanto si esto es necesariamente problemático como si no, ¿podría ser sintomático de patologías específicas en alguna etapa del análisis de los datos? Por ejemplo, ¿es posible hacer alguna declaración general sobre si tal desviación podría ser inducida por una cadena mal convergente, un modelo incorrecto o límites excesivamente estrechos en los parámetros?