1 votos

MLE de distribuciones binomiales negativas de diferentes tamaños

Hay dos equipos que compiten en una serie de partidos. Estos partidos son al mejor de $x$ formato, así que después de que cualquiera de los equipos gane $\lfloor{\dfrac{x}{2}}\rfloor+1$ la serie ha terminado. Se trata, en esencia, de una distribución binomial negativa.

Estos dos equipos juegan unos partidos distintos, con diferentes $x$ y quiero saber cuál es la MLE de $p$ , donde $p$ es la probabilidad de que el equipo $1$ derrota al equipo $2$ .

Esto es lo que he intentado:

Nuestra función de probabilidad es la siguiente: $$ L(k_i, x_i; p) = \prod_{i=1}^n c_ip^{k_i}(1-p_i)^{x_i-k_i} $$ donde $x_i$ notas que coinciden $i$ fue una de las mejores $x$ y $k_i$ es el número de partidos ganados por el equipo $1$ .

Si el equipo $1$ ganó el partido $i$ entonces $c_i = \binom{x-1}{k-1}$ , si no $c_i = \binom{x-1}{k}$ . Toma el $\log$ de la probabilidad, encontramos:

$$ \log{L} = \sum_{i=1}^n c_i+\log(p)\sum_{i=1}^nk_i + \log(1-p)\sum_{i=1}^n(x_i-k_i) $$

diferenciando esto con respecto a $p$ y ponerlo en $0$ para encontrar el máximo, obtenemos eso:

$$ 0 = \dfrac{\sum_{i=1}^nk_i}{p} - \dfrac{\sum_{i=1}^n(x_i-k_i)}{1-p} $$ $$ 0 = (1-p)\sum_{i=1}^nk_i - p\sum_{i=1}^n(x_i-k_i) $$ $$ \sum_{i=1}^nk_i = p\left(\sum_{i=1}^nk_i + \sum_{i=1}^n(x_i-k_i) \right) = p\sum_{i=1}^nx_i $$

lo que nos lleva al resultado final

$$ p = \dfrac{\sum_{i=1}^nk_i}{\sum_{i=1}^nx_i} = \dfrac{wins}{games} $$

A partir de aquí me mostré un poco escéptico con este resultado, así que simulé conjuntos de partidos para diversas probabilidades de victoria entre equipos para encontrar la MLE numérica.

Por ejemplo, hice el escenario en el que hay son $2$ Lo mejor de $1$ s, y un Best-of- $5$ . Equipo $1$ pierde lo mejor de $1$ s, pero gana el Best-of- $5$ $3$ - $1$ . Numéricamente, he encontrado que la MLE es $p\approx .65$ pero usando la MLE que acabo de encontrar obtendría eso

$$ p = \dfrac{0+0+3}{1+1+4} = \dfrac{1}{2} $$

3voto

SiongthyeGoh Puntos 61

La probabilidad que queremos maximizar para su ejemplo es

$$(1-p)\cdot (1-p)\cdot 3 \cdot p^3\cdot (1-p)=3[p(1-p)]^3$$

En efecto, tiene un valor máximo en $p=0.5$ .

enter image description here

Tal vez quiera comprobar su simulación. Si la probabilidad de éxito es superior a $0.5$ Debemos esperar que el equipo gane con más frecuencia.

3voto

heropup Puntos 29437

La terminología es confusa y no está suficientemente precisada, lo que me gustaría abordar estableciendo algunas definiciones y notación.

Llamemos a un juego una única instancia de competencia entre los dos equipos, que denotaré por $A$ y $B$ en el que el resultado del juego es $1$ si el equipo $A$ gana, y $0$ si el equipo $A$ pierde. En otras palabras, el resultado que estamos contando en un solo juego es el número de puntos ganada por el equipo $A$ .

A coinciden con comprende una secuencia de juegos, de los cuales hay un número predeterminado de juegos llamados longitud del partido y el resultado del partido es a favor del equipo con más partidos ganados en el partido. El resultado del partido se expresa por el total de puntos ganados por $A$ .

A serie comprende múltiples partidos, en los que la longitud de los partidos puede variar de un partido a otro. El ganador de la serie se determina de forma similar a las decisiones de los partidos; es decir, el equipo que gane más partidos gana la serie.

Definamos ahora algunas notaciones. Sea $m$ representan el número de partidos jugados, y para cada $i = 1, 2, \ldots, m$ , dejemos que $n_i$ representan la longitud del partido $i$ . Además, dejemos que $X_i$ representan el número aleatorio de partidos/puntos ganados por el equipo $A$ en el partido $i$ .

A continuación, supongamos que los resultados de los juegos individuales son independientes e idénticamente distribuidos, en los que la probabilidad del equipo $A$ ganar un partido/punto es $p$ y la probabilidad del equipo $B$ ganar un partido/punto es $q = 1-p$ . Entonces el número de victorias $X_i$ para el equipo $A$ en el partido $i$ es una variable aleatoria binomial; $$X_i \sim \operatorname{Binomial}(n_i, p), \quad i = 1, 2, \ldots, m.$$ Además, cada $X_i$ se supone que son independientes, aunque no se distribuyen idénticamente, ya que $n_i$ pueden no ser iguales para cada $i$ .

El objetivo es estimar $p$ a partir de los datos observados $$\boldsymbol x = (x_1, x_2, \ldots, x_n)$$ y las longitudes de los partidos $\boldsymbol n = (n_1, n_2, \ldots, n_m)$ donde cada $x_i$ es el resultado del partido $i$ . En este caso, hay que tener en cuenta que la distribución conjunta de $\boldsymbol x$ es $$f_{\boldsymbol X}(\boldsymbol x \mid p, \boldsymbol n) = \prod_{i=1}^m \binom{n_i}{x_i} p^{x_i} (1-p)^{n_i - x_i} = \left(\prod_{i=1}^m \binom{n_i}{x_i}\right) p^{\sum x_i} (1-p)^{\sum n_i - \sum x_i} = h(\boldsymbol x) g(T(\boldsymbol x) \mid p),$$ donde $$h(\boldsymbol x) = \prod_{i=1}^m \binom{n_i}{x_i}, \quad g(T \mid p) = p^T (1-p)^{\sum n_i - T}, \quad T(\boldsymbol x) = \sum x_i,$$ por el Teorema de la Factorización. En consecuencia, $$T(\boldsymbol x) = \sum x_i$$ es una estadística suficiente para $p$ y es un ejercicio sencillo demostrar que $$T \sim \operatorname{Binomial}(\Sigma n_i, p).$$ En consecuencia, la MLE de $p$ es expresable en función de $T$ y es la misma forma funcional que la MLE para la distribución binomial.

Lo que nos dice lo anterior es que si se conocen los resultados de los partidos, entonces no importa la duración de cada uno de ellos para estimar $p$ . Esto tiene sentido porque cada juego es una distribución independiente e idéntica $\operatorname{Bernoulli}(p)$ variable aleatoria.

La situación es más compleja, sin embargo, cuando en lugar de conocer los resultados de los partidos, sólo se conoce el partido resultado --es decir, si el equipo $A$ o equipo $B$ ganó el partido $i$ para cada $i = 1, 2, \ldots, m$ . (Sin embargo, como antes, se sigue conociendo la duración de los partidos, sólo que no se sabe cuántos puntos ganó cada equipo en cada partido). En este caso, la función de probabilidad es menos informativa, y debemos definir otra variable aleatoria para caracterizar esta situación.

En concreto, como se ha descrito anteriormente, el equipo $A$ gana el partido $i$ si $X_i \ge \lfloor n_i/2 \rfloor + 1$ . Esto, por supuesto, es problemático cuando $n_i$ es par, ya que una longitud de partido par admite un resultado de empate para ese partido con probabilidad $\binom{n_i}{n_i/2} (p(1-p))^{n_i/2}$ y no está claro en el enunciado de la pregunta cómo tratar ese caso. Así que, por el momento, vamos a suponer que $n_i$ es impar para todos $i$ . A continuación, definimos la variable aleatoria $$W_i = \begin{cases}1, & X_i > n_i/2 \newline 0, & x_i < n_i/2. \end{cases}$$ Entonces $$W_i \sim \operatorname{Bernoulli}(\pi_i), \quad \pi_i = \Pr[X_i > n_i/2] = \sum_{x = \lceil n_i/2 \rceil}^{n_i} \binom{n_i}{x} p^x (1-p)^{n_i-x}.$$ Entonces nuestra probabilidad debe ser construida a partir de la muestra $\boldsymbol w = (w_1, w_2, \ldots, w_m)$ en lugar de $\boldsymbol x$ y tenemos $$\mathcal L(p \mid \boldsymbol w, \boldsymbol n) = \prod_{i=1}^m \pi_i^{w_i} (1-\pi_i)^{1-w_i}.$$ La probabilidad logarítmica es $$\ell(p \mid \boldsymbol w, \boldsymbol n) = \sum_{i=1}^m w_i \log \pi_i + (1-w_i) \log (1 - \pi_i)$$ y buscamos un punto crítico que satisfaga $$0 = \frac{d\ell}{dp} = \sum_{i=1}^m \left( \frac{w_i}{\pi_i} - \frac{1-w_i}{1 - \pi_i} \right)\frac{d\pi_i}{dp}.$$ Como puedes ver, esto se está volviendo rápidamente intratable. Podríamos seguir calculando la derivada, pero parece poco probable que podamos resolver analíticamente un punto crítico para una muestra general.

Pero, ¿podemos hacerlo para un caso sencillo? Supongamos que $m = 3$ , $\boldsymbol n = (5,3,7)$ y $\boldsymbol w = (1,1,0)$ . Entonces podemos calcular $$\begin{align*} \pi_1 &= p^3 \left(6 p^2-15 p+10\right) \newline \pi_2 &= (3-2 p) p^2 \newline \pi_3 &= p^4 \left(-20 p^3+70 p^2-84 p+35\right). \end{align*}$$ Nuestra probabilidad es $$\begin{align*} \mathcal L(p \mid \boldsymbol w, \boldsymbol n) &= \pi_1 \pi_2 (1-\pi_3) \newline &= -240 p^{15}+1800 p^{14}-5668 p^{13}+9602 p^{12}-9240 p^{11}+4795 p^{10} \newline &\quad -1050 p^9-12 p^8+48 p^7-65 p^6+30 p^5. \end{align*}$$ Esto confirma nuestra preocupación anterior sobre la trazabilidad, ya que el resultado es un polinomio de alto grado en $p$ para el que no es posible obtener una solución analítica para el máximo. Después de factorizar los puntos críticos triviales $p \in \{0, 1\}$ podemos utilizar un enfoque numérico (por ejemplo, el método de Newton) para localizar el único punto crítico en $(0,1)$ : $$\hat p \approx 0.55616759186866770384.$$ Así que podemos hacer el cálculo en la práctica, siempre que el número de juegos en un partido no sea demasiado grande ni el número de partidos demasiado grande, en cuyo caso el polinomio $\mathcal L$ tiene un grado muy alto.

¿Cómo podríamos confirmar el resultado anterior mediante una simulación? Una forma es simular numerosas muestras $\boldsymbol x$ cada una de ellas con algún tipo de $p$ extraído de una distribución uniforme en $(0,1)$ . A continuación, seleccione sólo las muestras correspondientes al resultado observado $\boldsymbol w$ . A continuación, calcule la media muestral de $p$ y comparar con la MLE. El problema de este enfoque es que se puede desperdiciar mucho esfuerzo computacional en la simulación de los resultados $\boldsymbol x$ que no dan lugar a la deseada $\boldsymbol w$ . Invito al lector interesado a idear una simulación más eficiente.


La probabilidad anterior puede ajustarse para considerar resultados empatados, en cuyo caso $w_i$ ya no es Bernoulli sino categórica. Además, el modelo se vuelve completamente diferente si suponemos que la duración del partido no está predeterminada, sino que se detiene cuando se alcanza un determinado margen de victorias (por ejemplo, una regla de "ganar por 2"). Pero la única interpretación de la pregunta original que tiene sentido para mí es considerar que la duración de los partidos es fija, ya que no se especificaba que hubiera que jugar un número mínimo de juegos en un partido, ni un número mínimo de partidos en una serie.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X