Supongamos que tenemos $n$ canicas y lanzarlas en $k$ cajas. $p_i$ es la probabilidad de que la canica caiga en $\#i$ -en la caja, $i=1,...,k$ y $\sum_{i=1}^kp_i=1$ . Supongamos que $Y_l$ es $1$ si $l$ -a las tierras de mármol en el $\#i$ -en la caja, y $0$ de lo contrario. Del mismo modo, $Z_l$ es una variable aleatoria igual a $1$ si $l$ -la quinta canica aterriza en el número de la caja $j$ .Let $X_i=\sum_{l=1}^n Y_l$ y $X_j=\sum_{l=1}^n Z_l$ . ¿Cómo puedo calcular $Cov(X_i,X_j)$ para $i\neq j$ inmediatamente de esta fórmula $Cov(X_i,X_j)=E[(X_i-E[X_i])(X_j-E[X_j])].$ I no quieren para utilizar esta consecuencia $Cov(X_i,X_j)=E[X_iX_j]-E[X_i]E[X_j].$ Esto se debe a que esta fórmula simplificada no contiene $X_i$ directamente, sino sólo a través de $E$ y puedo justificar que $E[X_iX_j]=0$ pero no sé qué debo sustituir por $X_i$ o $X_j$ en la fórmula original $E[(X_i-E[X_i])(X_j-E[X_j])].$ El resultado debería ser $Cov(X_i,X_j)=-np_ip_j.$
Respuestas
¿Demasiados anuncios?En primer lugar, hay que señalar que el $l$ a la bola que aterriza en el $i$ La caja es independiente de la $k$ a la bola que aterriza en el $j$ th box, siempre y cuando $l\neq k$ . Por lo tanto,
$$\text{Cov}(Y_l,Z_k)=0 \; \text{, if } \; l\neq k .$$
Sin embargo, cuando consideramos $\text{Cov}(Y_l,Z_l)$ sucede algo más: si el $l$ El balón cae en el $i$ de la caja, no puede caer en ninguna de las otras cajas. Por lo tanto, hay dependencia. Se pueden dar las tres situaciones siguientes
$$\begin{cases}Y_l=1 \; \text{ and } \; Z_l=0 & \text{ with probability } \; p_i \\ Y_l=0 \; \text{ and } \; Z_l=1 & \text{ with probability } \; p_j \\ Y_l=0 \; \text{ and } \; Z_l=0 & \text{ with probability } \; 1-p_i-p_j \end{cases}$$
El último caso corresponde a cuando la bola cae en otra casilla que la $i$ o $j$ th.
También puede determinar fácilmente que $\text{E}[Y_l]=p_i$ y $\text{E}[Z_l]=p_j$ por lo que ahora podemos pasar al cálculo de la covarianza
$$\text{Cov}(Y_l,Z_l) = (1-p_i)(0-p_j)p_i + (0-p_i)(1-p_j)p_j + (0-p_i)(0-p_j)(1-p_i-p_j) = -p_ip_j$$
Ahora, volviendo nuestra atención a $\text{Cov}(X_i,X_j)$
$$\text{Cov}(X_i,X_j)=\text{Cov}(\sum_{l=1}^n Y_l,\sum_{k=1}^n Z_k) = \sum_{l=1}^n\sum_{k=1}^n\text{Cov}( Y_l, Z_k) = \sum_{l=1}^n \text{Cov}( Y_l, Z_l) = -n p_i p_j \; .$$
Estoy de acuerdo con @owen88. Prácticamente siempre la expresión simplificada para la covarianza te llevará a la respuesta más rápido y fácil. Esto es más bien un comentario, pero es más fácil escribir las matemáticas en la sección de respuestas. Así que, en caso de que la teoría detrás del resultado no es clara, tenga en cuenta que por definición, tenemos $$Cov(X_i, X_j)=E[(X_i-E[X_i])(X_j-E[X_j])]$$ El término dentro de la expectativa es una variable aleatoria y podemos expandirla como sigue: $$E[X_iX_j-X_iE[X_j]-X_jE[X_i]+E[X_i]E[X_j]]$$ El hecho más importante del operador de expectativas es que es lineal. Así, podemos reescribirlo como $$E[X_iX_j]-E[X_iE[X_j]]-E[X_jE[X_i]]+E[E[X_i]E[X_j]]$$ A continuación, observamos que $E[X_i]$ y $E[X_j]$ son sólo constantes. Dado que el EV de una constante por una variable aleatoria es igual a la constante por el EV de la variable aleatoria, podemos reordenar para obtener $$E[X_iX_j]-E[X_i]E[X_j]-E[X_i]E[X_j]+E[X_i]E[X_j]E[1]$$ La simplificación da el resultado que nos interesa: $$Cov(X_i, X_j)=E[X_iX_j]-E[X_i]E[X_j]$$