Una lotería nacional tiene un formato en el que $7$ los números se eligen entre $45$ sin sustitución. La primera $6$ números elegidos constituyen los "números ganadores", mientras que el último número elegido es el "número adicional". Los participantes compran boletos que contienen seis números cada uno.
Los premios y las probabilidades de ganar publicados para la lotería son los siguientes, donde $(n,m)$ indica cuántos números de su boleto coinciden con los números ganadores y adicionales respectivamente. Tenga en cuenta que un boleto sólo se considera ganador del grupo más alto que puede ganar - por ejemplo, un boleto que gana en el Grupo 1 no se considera que haya ganado ninguno de los grupos inferiores.
- Grupo 1 : (6,0) - $1/8145060$
- Grupo 2 : (5,1) - $1/1357510$
- Grupo 3 : (5,0) - $19/678755$
- Grupo 4 : (4,1) - $19/271502$
- Grupo 5 : (4,0) - $703/543004$
- Grupo 6 : (3,1) - $703/407253$
Ahora, la junta de la lotería publica estadísticas sobre cuántos ganadores hay en cada grupo. Por ejemplo, en el último sorteo, el número de ganadores fue el siguiente: $(1,7,280,875,14347,21993)$ .
Utilizando estas cifras, ¿cuál es una buena manera de estimar el número de entradas compradas, con un intervalo de confianza?
Si sólo miro la información de un conjunto de probabilidades y número de ganadores, podré obtener una estimación (por ejemplo, estimaría que hubo 8145060 boletos comprados si sólo hubiera considerado los premios del Grupo 1). ¿Cómo puedo combinar toda la información que tengo utilizando la estadística bayesiana para generar una estimación mejor?
Actualmente, estoy considerando tratar el número de boletos ganadores en un grupo determinado como una Distribución Binomial, y luego aplicar el intervalo de Agresti-Coull, pero no estoy seguro de cómo combinar todos estos intervalos.