1 votos

Cálculo de una varianza complicada

En una lotería $n$ Los números se seleccionan a partir del $N$ números $1,2,\cdots,N.$ Hallar la varianza de la suma $S_n$ de los números seleccionados.

Mi idea:

Queremos encontrar $P(S_n=k)$ . Ahora, sería el número de soluciones de $$x_1+x_2+\dots+x_n=k$$ Satisfaciendo $x_i\ne x_j$ para $i\neq j$ y $1\le x_i\leq N$ para todos $i=1,2,\cdots, n$ . Pero, ¿cómo encontrar esta probabilidad? Esto parece una idea bruta, podría haber algo mejor pero sigo sin poder resolver esta ecuación, y sin tener ninguna idea mejor de todos modos. ¿Puede alguien ayudarme? Muchas gracias.

4voto

Did Puntos 1

En las loterías los números $(X_k)_{1\leqslant k\leqslant n}$ son distintos y se seleccionan uniformemente, por lo tanto, para cada $k$ , $$E(X_k)=\frac1N\sum\limits_{i=1}^Ni=\frac{N+1}2,\quad E(X_k^2)=\frac1N\sum\limits_{i=1}^Ni^2=\frac{(N+1)(2N+1)}6,$$ y, para cada $k\ne\ell$ , $$E(X_kX_\ell)=\frac1N\sum_{i=1}^Ni\frac1{N-1}\sum_{j\ne i}j=\frac1{N(N-1)}\left(\sum_{i=1}^Ni\right)^2-\frac1{N(N-1)}\sum_{i=1}^Ni^2,$$ es decir, $$E(X_kX_\ell)=\frac1{N(N-1)}\left(\frac{N(N+1)}2\right)^2-\frac1{N(N-1)}\frac{N(N+1)(2N+1)}6=\frac{(N+1)(3N+2)}{12}.$$ Así, $$E(S_n)=nE(X_1)=n\frac{N+1}2,$$ y $$\mathrm{var}(S_n)=nE(X_1^2)+n(n-1)E(X_1X_2)-n^2E(X_1)^2,$$ es decir, $$\mathrm{var}(S_n)=n\frac{(N+1)(2N+1)}6+n(n-1)\frac{(N+1)(3N+2)}{12}-n^2\frac{(N+1)^2}4,$$ que puede simplificarse como $$\mathrm{var}(S_n)=n(N-n)\frac{N+1}{12}.$$

1voto

Matthew Scouten Puntos 2518

Si $X_1, \ldots, X_n$ son los números seleccionados, $S_n = \sum_{k=1}^n X_k$ así que $\text{Var}(S_n) = \sum_{i=1}^n \sum_{j=1}^n \text{Cov}(X_i, X_j)$ . Sólo hay sólo dos casos a considerar, $i=j$ (que se produce $n$ veces) y $i \ne j$ ( $n^2 - n$ veces), por lo que $\text{Var}(S_n) = n \text{Var}(X_1) + (n^2-n) \text{Cov}(X_1,X_2)$ .

$X_1$ es igualmente probable que sea cualquiera de $1,2,\ldots,N$ . Escriba $X_1 = \sum_{i=1}^N i I_{\{X_1 = i\}}$ donde $I_E$ denota el indicador de evento $E$ (es decir $1$ si $E$ se produce, $0$ si no). Tenemos $E[I_{\{X_1=i\}}] =E[I_{\{X_1=i\}}^2]= 1/N$ así que $\text{Var}(I_{\{X_1=i\}}) = 1/N - 1/N^2$ , mientras que $I_{\{X_1=i\}} I_{\{X_1=j\}} = 0$ para $i \ne j$ así que $\text{Cov}(I_{\{X_1=i\}}, I_{\{X_1=j\}}) = - 1/N^2$ para $i \ne j$ . Así, $$\text{Var}(X_1) = \sum_{i,j} i j \text{Cov}(I_{\{X_1=i\}}, I_{\{X_1=j\}}) = \sum_{i=1}^N \dfrac{i^2}{N} - \dfrac{1}{N^2} \sum_{i=1}^N \sum_{j=1}^N ij = \dfrac{N^2-1}{12}$$ De la misma manera, $E[I_{\{X_1=i\}} I_{\{X_2=j\}}] = \dfrac{1}{N(N-1)}$ para $i\ne j$ , $0$ para $i=j$ Así que $$\text{Cov}(I_{\{X_1=i\}}, I_{\{X_2=j\}} = \cases{\dfrac{1}{N(N-1)} - \dfrac{1}{N^2} = \dfrac{1}{N^2(N-1)} & for $ i \ne j $\cr - \dfrac{1}{N^2} & otherwise}$$ así que $$ \text{Cov}(X_1,X_2) = \sum_{i=1}^N \sum_{j=1}^N \dfrac{ij}{N^2(N-1)} - \sum_{i=1}^N \dfrac{i^2}{N(N-1)} = -\dfrac{N+1}{12}$$ y por lo tanto $$ \text{Var}(S_n) = n \dfrac{N^2-1}{12} - (n^2-n) \dfrac{N+1}{12} = \dfrac{n (N+1)(N-n)}{12} $$

0voto

Michael Hardy Puntos 128804

Si son elegidos independientemente entre sí, entonces la varianza de la suma es la suma de las varianzas, por lo que sería $n$ veces la varianza del número elegido al azar entre $1,\ldots,N$ .

De hecho, esa es la razón por la que se utilizan las desviaciones estándar como medida de dispersión, en lugar de las aparentemente más simples y obvias distancias medias. Si un número entre $1,2,3,4,5$ se elige al azar, cada uno con una probabilidad $1/5$ de ser elegido, entonces la media es $3$ y las distancias de $3$ son: $$ \begin{align} 1 & \mapsto |1-3|=2 \\ 2 & \mapsto |2-3|=1 \\ 3 & \mapsto |3-3|=0 \\ 4 & \mapsto |4-3|=1 \\ 5 & \mapsto |5-3|=2 \end{align} $$ La media de estos es $(2+1+0+1+2)/5=1.2$ ¿Por qué no utilizar que ¿en lugar de la más complicada desviación estándar, como medida de dispersión? La respuesta es que si se eligen mil números de esa manera y se suman, no hay una forma fácil de encontrar la cantidad correspondiente a la suma. Pero con las varianzas es fácil: basta con hacer lo que he dicho en el primer párrafo anterior. Y a partir de la varianza se obtiene la desviación típica.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X