¿Cómo calcular la cobertura de intervalos discretos?
Lo que sé hacer:
Si tuviera un modelo continuo, podría definir un intervalo de confianza del 95% para cada uno de mis valores predichos, y luego ver con qué frecuencia los valores reales se encontraban dentro del intervalo de confianza. Podría descubrir que sólo el 88% de las veces mi intervalo de confianza del 95% cubre los valores reales.
Lo que no sé hacer:
¿Cómo hago esto para un modelo discreto, como poisson o gamma-poisson? Lo que tengo para este modelo es lo siguiente, tomando una sola observación (de más de 100.000 que planeo generar:)
Observación #: (arbitraria)
Valor previsto: 1,5
Probabilidad prevista de 0: .223
Probabilidad prevista de 1: .335
Probabilidad prevista de 2: .251
Probabilidad prevista de 3: .126
Probabilidad prevista de 4: .048
Probabilidad prevista de 5: .014 [y 5 o más es .019]
...(etc)
Probabilidad prevista de 100 (o de alguna otra cifra irreal): .000
Valor real (un número entero como "4")
Tenga en cuenta que, aunque he dado valores de Poisson arriba, en el modelo real un valor predicho de 1,5 puede tener diferentes probabilidades predichas de 0,1,...100 a través de las observaciones.
Me confunde la discreción de los valores. Un "5" está obviamente fuera del intervalo del 95%, ya que sólo hay 0,019 en 5 y más, que es menos de 0,025. Pero habrá un montón de 4's -- individualmente están dentro, pero ¿cómo evalúo conjuntamente el número de 4's de forma más apropiada?
¿Por qué me importa?
Los modelos que estoy estudiando han sido criticados por ser precisos a nivel agregado pero por dar malas predicciones individuales. Quiero ver hasta qué punto las malas predicciones individuales son peores que los intrínsecamente amplios intervalos de confianza predichos por el modelo. Espero que la cobertura empírica sea peor (por ejemplo, podría encontrar que el 88% de los valores se encuentran dentro del intervalo de confianza del 95%), pero espero que sólo sea un poco peor.