5 votos

Problema del cupón generalizado, o problema del cumpleaños al revés.

Quiero resolver una variación del Problema del cobrador de cupones o (alternativamente) una ligera variante del problema estándar del cumpleaños. Tengo una ligera variante del estándar cumpleaños problema .

En el problema estándar del Recolector de Cupones, alguien elige cupones al azar (con sustitución) de entre n posibles cupones diferentes. Los cupones duplicados no nos sirven de nada; necesitamos un conjunto completo. La pregunta estándar es "¿Cuál es el número esperado de cupones (o la distribución de probabilidad en el número de cupones) para reunirlos todos?

En el problema estándar del cumpleaños, elegimos k elementos de entre n opciones con reemplazamiento (como k personas en una habitación, cada una con una de las 365 fechas de cumpleaños posibles) e intentamos determinar la distribución de probabilidad para cuántos valores únicos habrá (¿tendrán el mismo cumpleaños?).

En mi problema, alguien ha elegido k elementos entre n opciones y sé que había p valores distintos, pero no sé cuál era k. Si p = n este es el problema del cupón, pero quiero permitir que los valores de p que son menores que n. Quiero determinar la distribución de probabilidad para k (en realidad, todo lo que necesito es el valor esperado de k, pero la distribución sería interesante también) como una función de p y n.

0 votos

Usted dice "Si $p=n$ este es el problema del cupón". Eso sólo es cierto si pretendías que la pregunta se interpretara como en la segunda parte de la respuesta de Henry.

2voto

Nikolai Prokoschenko Puntos 2507

Para hacerlo correctamente, se necesita algún tipo de distribución subyacente para $k$ . Por ejemplo, se podrían utilizar métodos bayesianos: empezar con una distribución a priori para $k$ multiplícalo por la probabilidad de ver $p$ para cada $k$ dado $n$ y dividir por una constante para obtener una distribución de probabilidad posterior para $k$ . A continuación, podría tomar la media, la mediana o la moda de esa distribución posterior como estimación central; con una prioridad uniforme inadecuada, tomar la moda daría la estimación de máxima probabilidad.

Otro enfoque basado en el cálculo del cobrador del cupón podría ser suponer que la persona pretendía conseguir $p$ distintos y se detenía cuando se alcanzaba este objetivo. En ese caso, el valor esperado de $k$ sería $$\sum_{j=n-p+1}^n \frac{n}{j} = n(H_n - H_{n-p}) \approx n \log_e \left(\frac{n}{n-p}\right) $$ aunque la dispersión sería relativamente amplia. $H_n$ es el $n$ número armónico.

0 votos

Gracias. Esa era la confusión fundamental que tenía. Resulta que tu suposición (que pretendían obtener p elementos distintos) es casi correcta. En realidad, lo que está sucediendo es que un proceso está haciendo selecciones, pero no podemos observar las selecciones, sólo cuántos valores únicos fueron seleccionados. Queremos continuar ese proceso hasta que tengamos "confianza" (algún umbral de probabilidad aún por definir) en que se ha realizado al menos un determinado número de selecciones.

1voto

John Smith Puntos 53

Se trata de un problema estadístico, no probabilístico: se tienen datos observados (el valor $p$ ) y tratar de inferir el proceso probabilístico subyacente (el parámetro $k$ ). El proceso que va de $k$ a $p$ se entiende, pero lo contrario es mucho más difícil. No se puede "resolver" este problema de estimación de parámetros.

El estimador de máxima verosimilitud de $k$ sería $\hat k = p$ . Otros criterios estadísticos conducirían a estimaciones diferentes.

0 votos

Ese no es el estimador de máxima verosimilitud. Por ejemplo, tomemos $n=4$ y $p=3$ la probabilidad de $k=3$ es $0.375$ mientras que la probabilidad para $k=4$ es $0.5625$ y para $k=5$ es aún mayor.

0 votos

...para $k=5$ la probabilidad es $0.5859375$ y para $k=6$ es $0.52734375$ Así que $\hat{k}=5$ no $3$ .

0 votos

@Henry, ¿esto no depende de si elegimos $k$ ¿artículos con o sin sustitución?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X