6 votos

Probabilidad de un par de pares de filas tenga la misma suma de vectores

Deje $X$ ser un azar plaza de $n$ $n$ matriz con $X_{i,j} \in \{0,1\}$. ¿Cuál es la probabilidad de que existan un par distinto de los pares de filas que tienen el mismo vector suma?

Si se agregan dos filas elementwise, a continuación, cada entrada tiene $0$ con una probabilidad de $1/4$, $2$ con una probabilidad de $1/4$ $1$ con una probabilidad de $1/2$ y son independientes. Así que si los dos pares son disjuntas la probabilidad de que son de la misma es $(1/4^2 + 1/2^2+1/4^2)^n = (3/8)^n$. Si los dos pares que tienen una fila en común la probabilidad es $1/2^n$.

¿Cómo puede usted utilizar estos datos para dar la probabilidad final?


Aclaración:

Si dejamos $r_i$ fila $i$, entonces quiero $i,j,k,\ell$ tal que $r_i+r_j = r_k+r_{\ell}$ con la regla 1) que no podemos tener ambas $i\in \{k,\ell\}$ $j \in \{k,\ell\}$ y la regla 2) que tanto $i \ne j$ $k \ne \ell$ mantener.

2voto

Mike Powell Puntos 2913

Vamos a responder (aproximadamente) la pregunta por $m \times n$ matrices para la claridad, y acaba de establecer $m = n$ al final.

Como usted dice, por la suma de cualquiera de las dos filas $i_1$$i_2$, para una columna en particular $j$, $j$th entrada en la suma de las dos filas del es $0$ w.p. $\frac14$, $1$ w.p. $\frac24$, e $2$ w.p. $\frac14$, y las diferentes columnas son independientes.

Así que la probabilidad de que dos distintos pares de filas tienen la misma suma es la probabilidad de que en cada posición de la columna $j$, cada uno de los dos pares que tiene la misma suma, que es $p = (\frac1{4^2} + \frac1{2^2} + \frac1{4^2})^n = (3/8)^n$. La probabilidad de que dos pares de filas que comparten una fila en común tienen la misma suma es la probabilidad de que en cada una de las $j$ posiciones, tanto de los "otros" filas tienen el mismo elemento, que es $q = (1/2)^n$.

Ahora, para hallar la probabilidad de que existen dos pares de $\{i, j\} \neq \{k, l\}$ con la misma suma, podemos usar la inclusión-exclusión principio. Para la primera aproximación, la probabilidad es la suma sobre todos los pares de pares: $$\sum_{\{i, j\} \neq \{k, l\}} \Pr(r_i + r_j = r_k + r_l)$$

Para evitar overcounting pares de pares, digamos que sólo cuentan las tuplas $(i, j, k, l)$ que son en cierto orden canónico, dicen $i < j$, $k < l$, y los dos pares de $(i, j)$ $(k, l)$ de las mismas son distintas y en lexicográfica del orden. Entonces

  • con $\{i, j\}$ $\{k, l\}$ distinto, hay $\frac{m(m-1)(m-2)(m-3)}{8}$ dichos pares de pares - se puede llegar a este número como $\frac12 \binom{m}{2}\binom{m-2}{2}$ o $3\binom{m}{3}$, o lo que sea, y
  • con una fila en común ( $i=k$ , de modo que $k = i < j < l$) o $j = k$, de modo que $i < j = k < l$) o $j = l$, de modo que $i < k < l = j$), hay $\frac{m(m-1)(m-2)}{2}$ dichos pares de pares.

Por lo que la anterior suma es $$\frac{m(m-1)(m-2)(m-3)}{8}p + \frac{m(m-1)(m-2)}{2}q.$$

Esto es estrictamente una cota superior de la probabilidad de que, como se overcounts casos donde varios pares de pares de cada uno tienen la misma suma. Para refinar la suma, tenemos que considerar estos casos (el segundo término en la inclusión-exclusión de la suma).

¿Cuál es la probabilidad de situaciones donde varios términos en el anterior se suma positiva (es decir, ocurren simultáneamente)?

Hay muchas maneras en que esto puede suceder, pero tenga en cuenta que términos como $p^2$, $pq$, $qp$ o $q^2$ son todos exponencialmente más pequeño que el de primer orden de la suma. Así que para un gran $n$, no vale la pena preocuparse de tales términos. La única manera en la que múltiples eventos pueden suceder, cuya probabilidad es no exponencialmente más pequeños, son las formas en que las dos filas iguales conducir a varios pares de pares con la misma suma. Así que echemos un vistazo a estos para la segunda (y también a la tercera y superior) sumas de orden.

Si dos filas $a$ $b$ son iguales, entonces para cada par de pares como $\{a, i\}$$\{b, i\}$, tendremos $r_a + r_i = r_b + r_i$. Y hay $(m-2)$ tales pares de pares. Y $\binom{m}{2}$ posibles pares de $(a, b)$. Por lo que la totalidad de la inclusión-exclusión suma, si nos interesa sólo el $(1/2)^n$ plazo, sería:

$$ \binom{m}{2}p \left((m-2) - \binom{m-2}{2} + \binom{m-3}{3} - \dots \right) = \binom{m}{2} p \left(1 - (1-1)^{m-2}\right) \\ = \binom{m}{2} q $$

Esto coincide con el cálculo directo como: la probabilidad de que dos filas iguales, es aproximadamente el $\binom{m}{2} (1/2)^n$.

Así que la respuesta (a un muy alto grado de aproximación) puede ser tomado como el anterior. De hecho, para la mayoría de los fines prácticos podemos aproximar aún más: la suma es asintóticamente (para $m$$n$) $$\sim \frac{m^2}{2}\frac{1}{2^n} \sim \frac{n^2}{2^{n+1}}$$ al $m=n$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X