3 votos

Estimación del número de billetes comprados en una lotería

Una lotería nacional tiene un formato en el que $7$ los números se eligen entre $45$ sin sustitución. La primera $6$ números elegidos constituyen los "números ganadores", mientras que el último número elegido es el "número adicional". Los participantes compran boletos que contienen seis números cada uno.

Los premios y las probabilidades de ganar publicados para la lotería son los siguientes, donde $(n,m)$ indica cuántos números de su boleto coinciden con los números ganadores y adicionales respectivamente. Tenga en cuenta que un boleto sólo se considera ganador del grupo más alto que puede ganar - por ejemplo, un boleto que gana en el Grupo 1 no se considera que haya ganado ninguno de los grupos inferiores.

  • Grupo 1 : (6,0) - $1/8145060$
  • Grupo 2 : (5,1) - $1/1357510$
  • Grupo 3 : (5,0) - $19/678755$
  • Grupo 4 : (4,1) - $19/271502$
  • Grupo 5 : (4,0) - $703/543004$
  • Grupo 6 : (3,1) - $703/407253$

Ahora, la junta de la lotería publica estadísticas sobre cuántos ganadores hay en cada grupo. Por ejemplo, en el último sorteo, el número de ganadores fue el siguiente: $(1,7,280,875,14347,21993)$ .

Utilizando estas cifras, ¿cuál es una buena manera de estimar el número de entradas compradas, con un intervalo de confianza?

Si sólo miro la información de un conjunto de probabilidades y número de ganadores, podré obtener una estimación (por ejemplo, estimaría que hubo 8145060 boletos comprados si sólo hubiera considerado los premios del Grupo 1). ¿Cómo puedo combinar toda la información que tengo utilizando la estadística bayesiana para generar una estimación mejor?

Actualmente, estoy considerando tratar el número de boletos ganadores en un grupo determinado como una Distribución Binomial, y luego aplicar el intervalo de Agresti-Coull, pero no estoy seguro de cómo combinar todos estos intervalos.

1voto

Tenga en cuenta que cada billete tiene $6$ de $45$ números, que ${45 \choose 6} = 8145060$ y que todos los denominadores de su tabla son divisores de este número. Si se suman las probabilidades de ganar, se obtiene $P_{win}=\frac{25410}{8145060}$ .

El número total de ganadores de esta semana es $37503$ por lo que si usted hace la muy fuerte suposición de que " todas las entradas se asignan al azar ", entonces una estimación razonable es que hubo $37503 \times \frac{8145060}{25410} \approx 12021416.2$ entradas vendidas.

Si ese es el orden de magnitud de los billetes, entonces la proporción de ellos que ganan tiene un intervalo de confianza (utilizando dos desviaciones estándar) de aproximadamente $P \pm 2\sqrt{P(1-P)/N}$ que se trata de $[0.003088, 0.003152]$ . Si se divide el número de ganadores entre los dos extremos del intervalo, se obtiene un intervalo de confianza para el número de entradas vendidas de aproximadamente $[11898723,12146666]$ .

Ignorando la precisión espuria, este intervalo de confianza es demasiado estrecho, porque en realidad algunos números son más populares que otros, y las pruebas sobre el número de boletos vendidos y los premios ganados muestran que la proporción de boletos ganadores varía drásticamente de un sorteo a otro: por ejemplo, en el última lotería nacional del Reino Unido (reglas diferentes) la proporción que ganaba era de aproximadamente $0.0176$ mientras que en el sorteo anterior la proporción fue de aproximadamente $0.0212$ La bola 47 del sorteo más reciente es menos popular que cualquiera de las bolas del sorteo anterior.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X