7 votos

¿Esta clase de cifrado tiene un nombre? ¿Qué debilidades tiene?

Algunos Antecedentes

En octubre me han preguntado por la escuela me enseñan a organizar y conducir 'con las manos en la criptografía de sesión" para un brillante grupo de niños de 13 años para seguir una charla sobre el Enigma por un ponente externo.

El plan es comenzar con algunos afín a cambio de una o de a dos, luego golpeó con una tarea de la creación y de la ruptura de monoalphabetic sustituciones en los equipos. Después de que me gustaría, al menos, para mostrarles algo más difícil, lo ideal interpolando en algún lugar entre monoalphabetics y enigma (mejor si puedo reciclar el dulce de código de macro que he escrito para ayudar con las dos primeras tareas, mejor aún si puedo reciclar a los niños' sistemas de cifrado). Que tiene todo lo que me llevó a "inventar" una clase particular de cifrado.

Los Sistemas De Cifrado

Dado un monoalphabetic sustitución de $g \in S_{26}$, evaluamos el texto cifrado de texto de carácter '$x$', $n$ los caracteres en la cadena, como $C(x,n)= g^n(x)$ donde $S_{26}$ es la permutación grupo de 26 elementos y $g(x)$ es la acción natural en el alfabeto.

Mi Pregunta(s)

Claramente no soy la primera persona a pensar de esto. Pero después de ir a través de la lista de wikipedia clásica cifrados en vano, como alguien que nunca había hecho ningún criptografía antes de ser encargado de esto, estoy perplejo. Lo que el dickens es esta clase de cifrado llamado?!

Dado que alguien tiene, probablemente, a pesar de esto antes, alguien tiene probablemente también trató de romper, y probablemente ha encontrado debilidades. Ir a través de texto cifrado y mirando debilidades, incluso si esto es todo lo que podría lograr, le creo todavía ser una buena actividad para el final, ya que representa un guiño hacia las actividades reales en Bletchley Park. Pero hasta ahora, la única debilidad que he sido capaz de encontrar sin una referencia es que el 26771144400th carácter debe ser la misma en el texto cifrado como en texto sin formato. Esto no es útil. Cuáles son los puntos débiles de esta clase de cifrado?

Y por último, ya que me pueden preguntar, después de haber dado los antecedentes, ha alguien tiene mejores ideas?

10voto

lowglider Puntos 562

No estoy seguro de si ese tipo particular de polialfabético sistema de cifrado de sustitución tiene un nombre específico.

Un ingenuo aplicación de la misma, el cifrado de la $n$º de la letra $n$ a veces, suena bastante laborioso: $O(n^2)$ a cifrar un $n$-mensaje escrito. Supongo que será mucho más fácil si usted se descomponen $g$ en los ciclos primero, aunque.

Supongo que una debilidad potencial sería el hecho de que cada letra pertenece siempre a un mismo ciclo. El inglés tiene muy pocas letras dobles, y por lo tanto el texto cifrado debe contener una mayor proporción de dígrafos de la forma $(x, g(x))$ de lo que cabría esperar por azar.

Otro enfoque podría ser que lo trate como el cifrado de Vigenère: si $g$ contiene un ciclo de longitud $k$, luego las cartas en que el ciclo será más probable que de costumbre para que se repita $k$ posición aparte en el texto cifrado. Incluso se podría generalizar estos dos métodos: si las letras $x$ $y$ $j$ pasos de distancia en $k$-carta de ciclo (es decir,$g^j(x) = y$, $g^k(x) = x$), a continuación, $x$ $y$ puede ser más probable que espera ser separados por $ak+j$ posiciones en el texto cifrado, donde $a \in \mathbb Z$.


Anexo

Aquí está una manera bastante fácil manera de romper este sistema de cifrado, dado un tiempo suficientemente largo del texto cifrado de la muestra (o muchos más corto muestras). He ilustrado este método con un ejemplo concreto (Orgullo y Prejuicio de Jane Austen, cortesía de Proyecto Gutenberg, cifrado con la clave QKLWDVEOSUZYGMFXACNPHJIBRT) a continuación:

Paso 1: en Primer lugar, desea identificar los ciclos de $g$. Para hacer esto, simplemente contar las frecuencias de cada letra en el texto cifrado y la trama en orden ascendente. La trama debe se ve algo como esto:

T: 11757 #######################
B: 11827 #######################
K: 11895 #######################
Z: 11898 #######################
P: 11927 #######################
X: 12048 #######################
H: 18161 ###################################
O: 18296 ###################################
V: 18370 ###################################
J: 18518 ####################################
F: 18570 ####################################
U: 18748 ####################################
R: 20536 ########################################
Y: 20547 ########################################
L: 20660 ########################################
C: 20889 ########################################
Q: 21642 ##########################################
A: 21691 ##########################################
E: 30275 ###########################################################
G: 30340 ###########################################################
S: 30346 ###########################################################
N: 30473 ###########################################################
I: 30516 ###########################################################
W: 30564 ###########################################################
D: 30564 ###########################################################
M: 30638 ############################################################

Observe que la trama se parece a una escalera: cada paso corresponde a un solo ciclo de $g$. Para este ejemplo, deliberadamente escogió un poco ambiguo caso, es bastante claro que hay dos de 6 ciclos ({T,B,K,Z,P,X} y {H,S,V,J,F,U}) y uno de 8-ciclo ({E,G,S,N,I,W,D,M}), pero no es muy claro si el resto de las letras ({R,S,L,C,Q,Un}) forman un único 6-ciclo, de dos 3-ciclos, o un 4-ciclo y un 2-ciclo. Afortunadamente, podemos probar a todos en el siguiente paso.

(Por cierto, incluso si usted no sabía lo de cifrado se utiliza, este tipo de escalera en forma de trama de frecuencia sería una buena sugerencia.)

Paso 2: una Vez que haya identificado los ciclos, usted todavía necesita para determinar el orden de las letras en cada uno de ellos. Una forma rápida de hacer esto es simplemente para contar las apariciones de cada letra del ciclo en las posiciones $n \equiv i \pmod k$ en el texto cifrado para cada una de las $i = 0, \ldots, k-1$ donde $k$ es la longitud del ciclo. Si, para cada una de las $i$, entonces usted puede ordenar las cartas por su frecuencia en esa posición, te esperamos ver algo como esto (para el 8-ciclo {E,G,S,N,I,W,D,M}):

0: E > N > I > S > D > M > W > G
1: D > M > S > N > W > G > I > E
2: W > G > N > M > I > E > S > D
3: I > M > E > G > S > D > N > W
4: S > G > D > E > N > W > M > I
5: N > W > E > D > M > I > G > S
6: M > D > I > W > G > S > E > N
7: G > W > S > I > E > N > D > M

Tenga en cuenta que no se repita en la columna de la izquierda; esto es debido a que una de las cartas en el ciclo (presumiblemente E) es bastante más común de lo que los otros que su cifrado, en $g^i$ domina la fila. A partir de esto, podemos deducir que el orden de las letras en este ciclo es, de hecho, (E→D→W→I→S→N→M→G(→E)).

Nótese, sin embargo, que los próximos dos columnas en la tabla de arriba se mezclan, presumiblemente porque las letras N y yo somos lo suficientemente cerca de la frecuencia de su pedido varía por casualidad. Todas las demás columnas, sin embargo, son simplemente cambió versiones de la primera, en la que se confirma que casi seguramente el orden correcto.

Si tratamos de hacer lo mismo con {R,S,L,C,P,A}, sin embargo, la salida se ve diferente:

0: A > L > R > Y > C > Q
1: Q > C > Y > L > R > A
2: A > R > L > C > Y > Q
3: Q > Y > C > L > R > A
4: A > L > R > C > Y > Q
5: Q > C > Y > R > L > A

A partir de esto, podemos suponer que {R,S,L,C,P,A} no es, en efecto, un ciclo. En su lugar, {a,Q} parece un probable 2-ciclo, que dejaría {R,S,L,C} como un 4-ciclo. De hecho, con estas suposiciones, la salida se ve mucho mejor:

0: A > Q
1: Q > A

0: R > L > C > Y
1: C > Y > L > R
2: L > R > Y > C
3: Y > C > R > L

Es claro que (A→(Q→A)) y (R→C→L→(Y→R)) son los ciclos. Aplicando la misma técnica que para el resto de los dos candidatos de los ciclos de da

0: O > H > U > F > V > J
1: F > O > H > V > J > U
2: V > F > O > J > U > H
3: J > V > F > U > H > O
4: U > J > V > H > O > F
5: H > U > J > O > F > V

y

0: T > B > P > K > Z > X
1: P > K > X > Z > B > T
2: X > Z > B > T > K > P
3: B > T > K > P > X > Z
4: K > P > Z > X > B > T
5: Z > X > T > B > K > P

a partir de la cual podemos deducir correctamente que $g$ es igual a (EDWISNMG)(AQ)(RCLY)(OFVJUH)(TPXBKZ) = QKLWDVEOSUZYGMFXACNPHJIBRT. Mirando el resultado de descifrado de salida (que ni siquiera nos tienen que hacer para adivinar la clave!) confirma que, de hecho, tiene sentido.

Tenga en cuenta que la simplista el análisis de frecuencia he utilizado en el paso 2 puede fallar si el ciclo se compone enteramente de raro letras con frecuencias similares. Sin embargo, en la medida que podamos descifrar la mayoría del texto cifrado correctamente, no debería ser demasiado difícil de resolver tales ciclos menores manualmente. Un gran problema con esta técnica es que es también tiende a fallar si la cantidad de texto cifrado disponible es demasiado pequeño para la frecuencia estadística de las diferencias que se destacan del ruido. Por otro lado, de otra manera extraordinariamente sólido: no hace suposiciones acerca de la carta real de la distribución de frecuencia de texto plano, excepto que no está demasiado cerca de uniforme.

1voto

Vincent Puntos 5027

Esto no es un algoritmo de cifrado que he encontrado antes, pero me parece que es ideal para sus propósitos. Es significativamente más difícil de romper que un cifrado de sustitución simple, pero--como otros han señalado, puede ser susceptible a los ataques, dado un texto cifrado lo suficientemente largo. ¡Usted tiene un estudio de caso!

0voto

Nathan Reed Puntos 3192

Eso es un buen sistema de cifrado entre mono-alfabético y enigma (aparte del cálculo de globo).

Si el mono-alfabético no es cíclica, para períodos de menos de 26 (por ejemplo, la aplicación repetida de un personaje que pasa a través de todos los otros personajes antes de volver a la original de caracteres después del 26 de aplicaciones), entonces usted tiene una buena oportunidad de romper un largo mensaje (análisis de frecuencias en el n*26+1 caracteres de ser el más rápido).

Si quieres darles un toque, diciéndoles que la primera parte del mensaje siempre ayuda!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X