Tengo un vector de frecuencias observadas que tienen valores cero en algunas células, y un vector de frecuencias esperadas generadas por un modelo. Me gustaría hacer una prueba de razón de verosimilitud más que un chi-cuadrado de la prueba porque tengo diferentes modelos anidados y le gustaría usar $2 \ln\cal{L}$ diferencia para evaluar los modelos.
Mi pregunta es cómo lidiar con las células cero? Es sensato para eliminar la contribución de la 0 de la célula como en el R-código de abajo? O debería combinar celdas o hacer una corrección de continuidad?
Ejemplo:
observed <- c(142,34,18,15,12,136,6,7,2,3,2,1,1,0,2)
expected <- c(141.99,53.33,32.59,23.66,18.78,15.77,13.75,12.33,11.3,10.54,
9.98,9.57,9.29,9.1,9.02)
2 * (sum(observed * log(observed/expected), na.rm=TRUE))
[1] 455.8816