Voy a ir a por este:
Para ver que el número de pares de igualdad de letras (colisión de letras) en el texto cifrado es realmente dada por
$$D_{\rm c} = \sum_{i=1}^{p}\sum_{α={\rm A}}^{\rm Z}\frac{M_{α}^{(i)}(M_{α}^{(i)}-1)}{2} + \sum_{i=1}^{p}\sum_{j=i+1}^{p}\sum_{α={\rm A}}^{\rm Z}M_{α}^{(i)}M_{α}^{(j)},$$
tenga en cuenta que:
Si la letra de $\alpha$ se produce $M_{\alpha}^{(i)}$ veces en el $i^{th}$ fila
a continuación, el número de veces que $\alpha$ choca con la propia en el $i^{th}$ fila es simplemente $$\binom{ M_{\alpha}^{(i)}}{2}=\frac{M_{α}^{(i)}(M_{α}^{(i)}-1)}{2},$$
El número de veces que $\alpha$ ocurren en la $i^{th}$ fila y el $j^{th}$ fila choca con sí mismo es, simplemente, $$M_{\alpha}^{(i)}M_{\alpha}^{(j)},$$
y, a continuación, suma adecuadamente para obtener los totales.
Ahora bien, la probabilidad de colisión de dos variables aleatorias independientes con la misma distribución de probabilidad es $\sum_{x \in \mathcal{X}} P_x^2$ aquí donde la suma sería de rango $\mathcal{X}=\{A,B,\ldots,Z\}$
Cuando la longitud de la fila es correcta, es decir, coincide con la palabra clave período, la coincidencia de distribución es el de las letras inglesas, que se determinó experimentalmente que es aproximadamente 0.065 basado en la frecuencia de las letras en inglés con $P_x$ mayor al $x=E$ etc.
Cuando la longitud de la fila no es igual a la palabra clave período, la coincidencia de distribución es la de un `azar" de lenguaje, el cual es modelado como tener una distribución uniforme sobre letras de 26, por lo que cada una de las $P_x=1/26,$ y la suma da $$\sum_{x \in \mathcal{X}} P_x^2=26\times(1/26^2)\approx 0.038.$$
Ahora, vuelvo a la ecuación de $2D_c$
$$2 D_{\rm c} = \sum_{i=1}^{p}\sum_{α={\rm A}}^{\rm Z} M_{α}^{(i)}(M_{α}^{(i)}-1) + 2 \sum_{i=1}^{p}\sum_{j=i+1}^{p}\sum_{α={\rm A}}^{\rm Z}M_{α}^{(i)}M_{α}^{(j)}\quad (1)$$
Estamos viendo en el caso de que la longitud de la fila es $p.$
Luego de la carta de las colisiones dentro de las columnas de obedecer las estadísticas de inglés, mientras que la carta de las colisiones entre las columnas de obedecer al azar de las estadísticas, ya que el alfabeto tiene (en general) ha cambiado por una letra diferente en cada columna.
Esto significa que el análisis se supone que la palabra clave tiene distintas letras, que pueden, en general, no ser el caso, esperemos que no tiene demasiadas ocurrencias de la misma letra! Si es elegido al azar y $p$ no es demasiado grande esto no tiene que ser un problema.
La segunda hipótesis que tenemos que hacer es que el texto cifrado fragmento es el tiempo suficiente para que las variables aleatorias se han acercado a sus expectativas. Por simplicidad, suponga $p|N,$, de modo que $N=Mp,$ lo contrario, el resultado es una aproximación.
El segundo término en el lado derecho de (1) cuenta $M^2p(p-1)$ pares de posibles colisiones entre columnas distintas, donde $M$ es el número de entradas en cada columna. Hay $M^2$ colisiones para cada par de columnas elegidas. Estas colisiones se producen en la tasa de $0.038$ por nuestro probabilística de la asunción de modo que el segundo término de (1) alcanza su media de $0.038\times M^2 p(p-1)$ en el último término en la reivindicada ecuación en la parte inferior de la pregunta.
El primer término en el lado derecho de (1) cuenta las colisiones dentro de la misma columna, que obedecen inglés estadísticas. Hay $M(M-1)$ ranuras para las colisiones que se producen en una columna dada en filas distintas, y hay $p$ columnas de este modo obtenemos $0.065\times M(M-1) p$. Pero la carta choca con la propia en la tasa de 1 por lo que hemos $pM$.
La adición de estos da
$$0.065 \times M(M-1) p + M p$$
que creo que es la expresión correcta para el resto de los reclamos de la expresión en lugar de
$$0.065 \times M^2 p - M p$$ como se afirma en la pregunta.