La edición o Levenshtein La distancia entre dos cadenas es el número mínimo de inserciones, supresiones y sustituciones de un solo símbolo para transformar una cadena en otra. Por ejemplo $$\operatorname{E}(01010,00100)=2.$$
Dejemos que $E_n$ sea una variable aleatoria que da la distancia de edición entre dos cadenas binarias aleatorias de longitud $n$ .
Qué límites se pueden encontrar para
$$\lim_{n \to \infty} \frac{\mathbb{E}(E_n)}{n} = c\;?$$
Según mis simulaciones no exhaustivas, $c \approx 0.288$ .
Existe un trabajo relacionado de Luecker sobre la longitud esperada de la subsecuencia común más larga que tiene límites inferiores y superiores de $0.788071n$ y $0.826280n$ . Esta fue una línea de trabajo iniciada originalmente por Chvatal y Sankoff . Sin embargo, la longitud de la subsecuencia común más larga y $n$ menos la distancia de edición no tienen por qué ser similares.