La distribución binomial negativa se ha convertido en un modelo popular para los datos de recuento (en concreto, el número esperado de lecturas de secuenciación dentro de una región determinada del genoma a partir de un experimento determinado) en bioinformática. Las explicaciones varían:
- Algunos la explican como algo que funciona como la distribución de Poisson de Poisson, pero con un parámetro adicional, lo que permite modelar la verdadera distribución, con una varianza no necesariamente igual a la media
- Algunos la explican como una mezcla ponderada de distribuciones de Poisson (con una distribución de mezcla gamma en el parámetro de Poisson)
¿Existe alguna forma de conciliar estos razonamientos con la tradicional definición de una distribución binomial negativa como modelo del número de éxitos de los ensayos Bernoulli antes de ver un cierto número de fracasos? ¿O debería pensar que es una feliz coincidencia que un mezcla ponderada de distribuciones Poisson con una distribución de mezcla gamma tenga la misma función de masa de probabilidad que la distribución binomial negativa?