12 votos

Visualizar la distribución binomial bivariada

Pregunta: ¿qué aspecto tiene una distribución binomial bivariada en un espacio tridimensional?

A continuación se muestra la función específica que me gustaría visualizar para varios valores de los parámetros; a saber $n$ , $p_{1}$ y $p_{2}$ .

$$f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1.$$

Obsérvese que hay dos restricciones; $x_{1}+x_{2}=n$ y $p_{1}+p_{2}=1$ . Además, $n$ es un número entero positivo, por ejemplo, $5$ .

He hecho dos intentos de trazar la función utilizando LaTeX (TikZ/PGFPLOTS). Al hacerlo, obtengo los gráficos de abajo para los siguientes valores: $n=5$ , $p_{1}=0.1$ y $p_{2}=0.9$ y.., $n=5$ , $p_{1}=0.4$ y $p_{2}=0.6$ respectivamente. No he conseguido implementar la restricción de los valores del dominio; $x_{1}+x_{2}=n$ Así que estoy un poco perplejo.

Una visualización producida en cualquier lenguaje estaría bien (R, MATLAB, etc.), pero estoy trabajando en LaTeX con TikZ/PGFPLOTS.

Primer intento

$n=5$ , $p_{1}=0.1$ y $p_{2}=0.9$

enter image description here

Segundo intento

$n=5$ , $p_{1}=0.4$ y $p_{2}=0.6$

enter image description here

Editar:

Como referencia, aquí es un artículo que contiene algunos gráficos. El título del artículo es "A new bivariate binomial distribution", de Atanu Biswasa y Jing-Shiang Hwang. Statistics & Probability Letters 60 (2002) 231-240.

Editar 2: Para mayor claridad, y en respuesta a @GlenB en los comentarios, a continuación se muestra una instantánea de cómo se ha presentado la distribución en mi libro. El libro no hace referencia a casos degenerados / no degenerados y demás. Simplemente lo presenta así y yo he buscado visualizarlo. Saludos. Además, como señala @JohnK, es probable que haya una errata con respecto a x1+x1=1, que él sugiere que debería ser x1+x1=n.

enter image description here

Imagen de la ecuación de:

Spanos, A (1986) Statistical foundations of econometric modelling. Cambridge University Press

5 votos

Pero no debería ser un continuo, ¿verdad? Ambas variables aleatorias son discretas.

1 votos

Entonces x1 y x2 son independientes, ¿es así? ¿Necesitas un gráfico pseudo-3D? ¿Sería aceptable un mapa de calor?

0 votos

@JohnK Correcto. Ese es otro problema de los dos gráficos; ¡un gráfico de barras/columnas sería más adecuado, efectivamente!

10voto

Sean Hanley Puntos 2428

Esto tiene dos partes: primero hay que averiguar cuáles son las probabilidades individuales y luego hay que trazarlas de alguna manera.

Un PMF binomial no es más que un conjunto de probabilidades sobre un número de "éxitos". Un PMF binomial bivariante será un conjunto de probabilidades sobre una red de posibles combinaciones de "éxitos". En su caso, tiene $n_i = n_j = 5$ por lo que (teniendo en cuenta que $0$ éxitos es una posibilidad) hay $6\times 6 = 36$ posibles resultados en la red / distribución binomial bivariada.

Primero podemos calcular las PMF binomiales marginales, porque eso es muy sencillo. Como las variables son independientes, cada probabilidad conjunta será simplemente el producto de las probabilidades marginales; esto es álgebra matricial. Aquí demuestro este proceso utilizando R código:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

En este punto, tenemos las dos matrices de probabilidades necesarias. Sólo tenemos que decidir cómo queremos representarlas. Para ser sincero, no soy un gran fan de los gráficos de barras en 3D. Porque R parece estar de acuerdo conmigo, hice estos gráficos en Excel:

b19 :

enter image description here

b46 :

enter image description here

0 votos

Gracias por la presentación más el código R. Esto me lleva a preguntar sobre x1+x2=n. Si esta condición se mantiene, debe haber sólo una línea de pilares como se presenta aquí: reference.wolfram.com/language/ref/MultinomialDistribution.html El gráfico de wolframio supongo que es lo que @Glen_b ha denominado caso degenerado. ¿Significa esto que has presentado el caso no degenerado?

1 votos

GraemeWalsh, mi presentación no muestra una binomial bivariada donde x1+x2=n. Como @Glen_b discutió ampliamente en los comentarios y en su respuesta, yo no llamaría a eso una "distribución binomial bivariada" sin calificarla. Además, significaría que x1 y x2 no son independientes, como dices en tu comentario de respuesta, sino perfectamente dependientes. La verdad es que no me di cuenta de que era una variante tan extraña (puedes culparme por no leer con suficiente atención). Como mostró Glen_b, esa versión sería una sola línea de pilares. Lo que yo presenté fue el caso no degenerado.

0 votos

@gung Me gustan tus nuevas tramas. Creo que tu discusión cubre el caso degenerado muy bien ("tienes que averiguar cuáles son las probabilidades individuales" realmente lo dice todo; los cálculos reales para el caso degenerado son triviales); yo sólo llevé a cabo esos cálculos triviales.

7voto

AdamSane Puntos 1825

La respuesta de gung es una buena respuesta para una binomial bivariada real, explicando bien los problemas (yo recomendaría aceptarla como una buena respuesta a la pregunta del título, que probablemente sea útil para otros).

El objeto matemático que realmente presentas en tu edición es realmente una binomial escalada univariante. Aquí $x_1$ no es el valor que toma la cuenta binomial sino la proporción (la binomial dividida por $n$ ).

Así que definamos bien las cosas. Obsérvese que no se ofrece ninguna definición de la variable aleatoria, así que nos quedamos con algunas conjeturas.

Dejemos que $Y_1\sim \text{binomial}(n,p_1),\:$ Obsérvese que cuando damos una fórmula matemática para $P(Y_1=y_1)$ es necesario qué valores $y_1$ puede tomar, así que $y_1=0,1,...,n$ . Sea $X_1=Y_1/n$ y observe que $x_1=0,\frac16,\frac26,...,1$ .

Entonces la ecuación que das es la pmf para $P(X_1=x_1)$ (señalando que $x_2=n-x_1$ y $p_2=1-p_1$ ).

Para $n=6,p_1=0.3$ se ve así:

enter image description here

Podemos poner $x_2$ en el gráfico anterior, simplemente colocando un segundo conjunto de etiquetas bajo el $x_1$ valores iguales a $1-x_1$ (quizás en un color diferente) para indicar el valor tomado por $x_2$ .

Podríamos considerarlo como una binomial bivariada degenerada (a escala):

enter image description here

pero es un poco exagerado llamar a lo que se define en el libro una binomial bivariada, (ya que es efectivamente una binomial univariada).

Suponiendo que alguien quiera generar un gráfico similar al de 3D, este pequeño trozo de código (R) se acerca bastante al segundo gráfico anterior:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Se necesita el scatterplot3d que contiene la función del mismo nombre).

Una binomial bivariada "verdadera" (no degenerada) tiene variación en ambas variables a la vez. He aquí un ejemplo de un tipo particular de binomio bivariante (no independiente en este caso). He recurrido a utilizar diferentes colores en el gráfico porque, de otro modo, es demasiado fácil perderse en el bosque de "palos".

enter image description here

Hay muchas formas de obtener un objeto que podría llamarse binomio bivariado; este tipo particular es uno en el que se tiene $X\sim\text{bin}(n_0,p)$ , $Y\sim\text{bin}(n_y,p)$ , $Z\sim\text{bin}(n_z,p)$ (todos independientes), entonces dejemos que $X_1=X+Y$ y $X_2=X+Z$ .

Así se obtiene el binomio $X_1$ y $X_2$ que están correlacionados (pero tiene la desventaja de que no produce correlaciones negativas).

Una expresión para la pmf de este tipo particular de distribución binomial bivariada se da en Hamdan, 1972 [1] pero no utilicé ese cálculo; uno puede hacer fácilmente el cálculo directo (convolución numérica). En este caso particular $n_0$ era de 4 y $n_y$ y $n_z$ eran sólo 2 cada uno, por lo que el cálculo numérico directo en toda la cuadrícula (49 valores en el resultado final) no es difícil ni oneroso. Se empieza con una bivariable degenerada (ambas dimensiones $=X$ ) similar a la degenerada de la imagen anterior (pero más pequeña y en la "diagonal principal" - $x_1=x_2$ en lugar de la antidiagonal ( $x_1+x_2=n$ ) y luego se suman los componentes independientes, repartiendo la probabilidad a lo largo y fuera de la diagonal.

[1]: Hamdan, M.A. (1972),
"Expansión canónica de la distribución binomial bivariada con índices marginales desiguales"
Revista Internacional de Estadística , 40 :3 (dic.), pp. 277-280

0 votos

Es bueno. También vale la pena señalar que en este caso $corr(X_1, X_2) = -1$

0 votos

Glen_b. Muchas gracias. Señalar que el objeto matemático que presenté (¡que me presentaron!) es un binomio bivariado degenerado (escalado) ¡ha sido muy útil! No lo sabía desde el principio. Por último, ¡una petición elemental! ¿Sería posible que fueras explícito (por medio de la notación matemática) sobre cómo defines un binomio bivariado verdadero o real? Creo que eso sería útil.

1 votos

@Graeme Como ya mencioné en los comentarios (/respuesta), hay muchas formas de obtener un objeto que podría llamarse binomio bivariado (de hecho el título de la referencia de Biswasa y Hwang en tu pregunta te lo dice). Esto no es exclusivo de la binomial, por supuesto, hay muchas generalizaciones bivariadas disponibles de muchas de las distribuciones univariadas más utilizadas. El "tipo particular de binomial bivariante" que di en mi respuesta es uno en el que tienes $X\sim\text{bin}(n_0,p)$ , $Y\sim\text{bin}(n_y,p)$ , $Z\sim\text{bin}(n_z,p)$ (todos independientes), entonces dejemos que $X_1=X+Y$ y $X_2=X+Z$ . ... ctd

4voto

Mathematica es ahora bastante fuerte en estas cosas - tiene la solución de su problema justo en documentación . Con pequeños añadidos he hecho un modelo para jugar (con p = p1 = 0.4 para una mejor presentación visual). Así es como se ve la interfaz y cómo se puede controlar.

enter image description here

Recortes

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Lo principal aquí es PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}] que se explica por sí mismo, creo. Multinomial sólo significa que puede tomar muchas distribuciones con cada pi para la variable respectiva. La forma simple es BinomialDistribution . Por supuesto, podría hacerlo manualmente, pero la regla es que si tienes una función incorporada, debes usarla.

Si necesitas algún comentario sobre la estructura del código, por favor, házmelo saber.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X