Problemas:
Es bastante simple: tenemos una lista de números de x1,x2,…,xn,…,xm. Nuestro objetivo es al azar y de manera uniforme elegir un subconjunto de a n muchos números de estos.
Esto significa que, para cualquier i∈{1,2,…,n,…,m}, la probabilidad de elegir el valor de xi debe ser: n1m=nm
Un algoritmo:
Una instrucción es swap(xleft,xright). Es simplemente cambia sus valores. I. e.
- t:=xleft
- xleft:=xright
- xright:=t
Una propuesta de algoritmo: para cada una de las i∈{1,2,…,n}, de forma aleatoria y uniformemente elegir algunos ki∈{1,2,…,n,…,m}, y, a continuación, ejecute swap(xi,xki). Luego regresar x1,x2,…,xn como el conjunto de n-muchos de los números elegidos.
El reto:
Intuitivamente, que el algoritmo a mi me parece perfectamente bien. No veo absolutamente ningún problema en ello.
Pero cuando trato de mirar matemáticamente, no puedo probarlo. En lugar de eso, me parece realmente de demostrar que no es una solución correcta!
En primer lugar, echemos un vistazo a la probabilidad de elegir la primera de las n números:
Para cualquier i∈{1,2,…,n}, xi puede ser elegido si:
- xi existe en la mano derecha de swap. Hay exactamente n de los casos, incluyendo el caso al xi existe en tanto, la izquierda y la mano derecha.
- xi existe en la mano izquierda, de tal manera que no existe xj en la mano derecha tal que j∈{1,2,…,n}. Hay exactamente n tales casos, uno de los cuales es el caso cuando se i=j que hemos contado anteriormente. Por lo tanto, para evitar el recuento de los casos de i=j dos veces, suponemos que no se n−1 de los casos.
No hay ningún otro caso en que xi es elegido. Por lo tanto, la probabilidad de elegir un número xi, dado que el i∈{1,2,…,n} es: n+(n−1)m2
Ahora, echemos un vistazo a la probabilidad de elegir el restablecimiento de los números hasta el m:
Para cualquier i∈{n+1,n+2,…,m}, xi puede ser elegido si:
- xi existe en la mano derecha, de tal manera que no existe xj en la mano derecha tal que j∈{1,2,…,n}. Hay exactamente n de esos casos.
No hay ningún otro caso de tener xi elegido. Así que la probabilidad de elegir a xi es: nm2
La comparación de las probabilidades:
Que dice que hay un sesgo. La probabilidad de elegir el 1 n números es mayor que la probabilidad de elegir el restablecimiento de los números hasta el mth
Mi pregunta:
¿De dónde me salen mal? Cómo abordar este problema?