Vamos $Y_0$, $Y_1$, y $Y_2$ ser mutuamente estocásticamente independientes de variables aleatorias de Poisson, con un resultado positivo de parámetros $\lambda_0$, $\lambda_1$ y $\lambda_2$, respectivamente. Entonces, no trivial de la bivariante distribución de Poisson es una distribución conjunta de $X_1$ $X_2$ donde:
$$X_1 = Y_1 + Y_0$$
$$X_2 = Y_2 + Y_0$$
with joint pmf:
$$f(x_1,x_2) = \frac{e^{(-\lambda_0 - \lambda_1 -\lambda_2)} \lambda _0^{x_1} \left(-\lambda _2\right)^{-x_1} \lambda _2^{x_2} }{x_1!x_2!} U\left(-x_1,1-x_1+x_2,-\frac{\lambda _1 \lambda _2}{\lambda _0}\right)$$
defined on $x_i \{0, 1, \dots}$, and where $U(.)$ denotes the confluent hypergeometric function. Finally, let $(x_1^m,x_2^m)$ denote the bivariate mode ... i.e., the value of $(x_1,x_2)$ at which $f(x_1,x_2)$ is a maximum.
A Natural Starting Point
Correctly, the mode of each univariate Poisson distribution is:
$$ \begin{cases}\lfloor \lambda_i \rfloor & \text{if } \lambda_i \text{ is not an integer } \\ \lambda_i - 1 \text{ and } \lambda_i \text{ (two modes)} & \text{if } \lambda_i \text{ is an integer } \end{cases}$$
Because the sum of independent Poisson random variables is itself Poisson, the marginal pmf of $X_1 = Y_1 + Y_0$ is $Poisson(\lambda_1 + \lambda_0)$, and similarly, the marginal pmf of $X_2 = Y_2 + Y_0$ is $Poisson(\lambda_2 + \lambda_0)$.
Then, a natural starting point (at least for the general non-integer parameter case) is that the bivariate mode might be located at $(\lfloor \lambda_1 + \lambda_0 \rfloor, \lfloor \lambda_2 + \lambda_0 \rfloor)$.
More Complicated than that ...
However, there are good theoretical reasons why the mode might not be exactly (or uniquely) defined by: $(\lfloor \lambda_1 + \lambda_0 \rfloor, \lfloor \lambda_2 + \lambda_0 \rfloor)$ . In particular, since:
$$corr(X_1,X_2) = \frac{\lambda_0}{\sqrt{(\lambda_0+\lambda_1) (\lambda_0+\lambda_2)}}$$
... the positive correlation between $X_1$ and $X_2$ may shift the density mass away from the modes of the marginal distributions.
For an algebraic test of modality, in a discrete world one typically looks at a ratio such as $\frac{f(x_1,x_2)}{f(x_1+1,x_2+1)}$ to see where it is greater than 1 etc. But the HypergeometricU function makes this seemingly intractable.
But, it is even more complicated than that, as a quick numerical investigation reveals peculiar non-monotonic behaviour. For example:
- When $(\lambda_0 = 4.99, \lambda_1 = 3.1, \lambda_2 = 2.493)$ $\a$ mode is: $(x_1=8,x_2=7)$
- Cuando $(\lambda_0 = 4.99, \lambda_1 = 3.1, \lambda_2 = 2.494)$ $\to$ el modo es: $(x_1=7,x_2=7)$
... así como un pequeño incremento en $\lambda_2$ a veces causan $x_1^m$ a DISMINUIR, mientras que $x_2^m$ permanece sin cambios. [ Estos cálculos fueron realizados utilizando métodos exactos con todos los números representados como simbólica EXACTA puro enteros, es decir, 2.494 representado como 2494/1000 en Mathematica, para evitar cualquier posibilidad de numérico o error de redondeo. ]
Lamentablemente, esto sugiere que la perspectiva de la obtención definitiva de los teóricos de la derivación parece remoto ... Como tal, he avanzado con un numérico de la exploración.
BivariatePoissonMode
He aquí algunos de Mathematica código que se encuentra en el modo de evaluar el pmf $f(x_1,x_2)$ en todas las combinaciones posibles de $x_1$$x_2$, y la selección de la combinación que genera la máxima:
BivariatePoissonMode[a0_, a1_, a2_] :=
Module[{f, x1, x2, m01 = Floor[a0 + a1], m02 = Floor[a0 + a2]},
f = ((1/(x1!*x2!))*a0^x1*a2^x2*Exp[-a0 - a1 - a2]*
HypergeometricU[-x1, 1 - x1 + x2, -((a1*a2)/a0)])/(-a2)^x1;
Rest[First[Sort[
Flatten[Table[{f, x1, x2},
{x1, Max[0, m01 - 3], m01 + 3}, {x2, Max[m02 - 3, 0], m02 + 3}], 1],
#1[[1]] > #2[[1]] & ]]]]
Por ejemplo, dada $(\lambda_0 = 2,\lambda_1 = 3, \lambda_2 = 4)$:
BivariatePoissonMode[2,3,4]
devuelve el modo en:
{4,5}
BivariatePoissonMode[2.2, 3.2, 4.2]
devuelve el modo en:
{5,6}
Si uno quiere comprobar la totalidad del espacio de parámetros en virtud de la parcela, uno puede hacerlo, aunque esta no es una manera eficaz de proceder ... En lo anterior, la se ha configurado la función a evaluar todos los $x_1$ $x_2$ valores más o menos 3 números enteros a partir de la solución óptima derivados a continuación.
Resumen de los resultados
La función anterior fue asignada a más de 1 millón estrictamente no-entero combinaciones de $(\lambda_0,\lambda_1, \lambda_2)$ cada uno, desde aproximadamente 0,1 a 35, y por separado, 64000 entero combinaciones de $(\lambda_0,\lambda_1, \lambda_2)$ cada uno de los que van de 1 a 40.
El resultado es que, dentro de la cuadrícula numérica de búsqueda, sin excepción:
- Estrictamente entero con valores de los parámetros, el modo es:
$$(x_1^m,x_2^m) = (\lambda_1 + \lambda_0 -1, \lambda_2 + \lambda_0 -1)$$
- Para cualquier conjunto de parámetros que contiene no enteros, el modo es:
$$(x_1^m, x_2^m) = (\lfloor \lambda_1 + \lambda_0 \rfloor - \delta_1, \lfloor \lambda_2 + \lambda_0 \rfloor - \delta_2 ) \text{ where } \delta_i = 0 \text{ or } 1$$
As discussed above, it appears that it will be difficult to find a purely deterministic explanation of the $\delta_i$ behaviour. On the positive side, the bivariate Poisson mode can practically be found by testing $f(x_1,x_2)$ at just 4 combinations of $(x_1,x_2)$.
Other
Unlike the univariate case, the bivariate mode appears to always be unique.
Based on 1 million grid tests of non-integer combinations of $(\lambda_0,\lambda_1,\lambda_2)$:
- $\delta_1 = 0$ and $\delta_2 = 0$, $\a \text{ aproximadamente } 70$% del espacio de parámetros
- $\delta_1 = 0$ y $\delta_2 = 1$, $\to \text{ roughly } 12$% del espacio de parámetros
- $\delta_1 = 1$ y $\delta_2 = 0$, $\to \text{ roughly } 12$% del espacio de parámetros
- $\delta_1 = 1$ y $\delta_2 = 1$, $\to \text{ roughly } 5$% del espacio de parámetros
Esto también es algo que me gustaría ver para la estabilidad cuando tengo más tiempo.