Me gustaría comparar si la partición de un conjunto de datos está justificada. Los datos son categóricos con dos niveles y el parámetro ajustado es la prevalencia de positivos para una determinada condición en cada partición. He pensado hacer esto comparando el modelo con particiones contra el modelo sin particiones.
En un modelo, se ajusta un parámetro, simplemente a través del conjugado Beta a priori.
En el segundo, los datos se dividen según algún criterio y se ajustan dos parámetros, uno para cada grupo.
¿Cómo puedo decidir si la partición tiene sentido?