Parece que no entiendo el proceso de cálculo de los p-valores predictivos posteriores.
Digamos que tengo un conjunto de datos de concentración de 400 proteínas diferentes medidos en 9 ratas. Entonces: $x_{pr}$ para $r=1...9, p=1...400$
La forma en que entiendo que deben calcularse los p-valores predictivos posteriores es:
1) usted ejecuta su cadena MCMC
para cada muestra $'i'$ en su cadena (y cada proteína $'p'$ ):
2) se calcula la varianza de los datos reales $s^{2 (true)}_{p}$
3) se calcula la varianza de los datos simulados $s^{2 (pred)}_{p}$
4) se calcula $M_{ip} = I(s^{2 (pred)}_{p} > s^{2 (true)}_{p}) \in \{0,1\}$
Usted utiliza su $M_{ip}$ valores para calcular $P(s^{2 (pred)}_{p} > s^{2 (true)}_{p}) \approx \frac{\sum_{i}M_{ip}}{N}$ ( $N$ siendo el número total de muestras)
¿Lo he entendido bien? ¿Así que en total tenemos 400 valores p diferentes que oscilan entre 0 y 1? Además, ¿cómo debería ser si mi modelo es supuestamente bueno?