Consideremos primero un problema relacionado, el de las fuentes en mapa de bits (raster) en lugar de las fuentes vectoriales (por ejemplo, curvas de Bezier u otras funciones analíticas que representan cada curva, como en este problema).
En el caso de los mapas de bits, hay una forma obvia de proceder. Si la imagen de la fuente está representada por un $n\times n$ cuadrícula de píxeles, entonces cada usuario está especificando un elemento de $\{0,1\}^{n\times n}$ . Tomar la media en el espacio vectorial $\mathbb R^{n\times n}$ para obtener un elemento de $[0,1]^{n\times n}$ y aplicar algún tipo de redondeo para obtener una imagen en $\{0,1\}^{n\times n}$ .
Consideremos ahora el análogo continuo de esto. Supongamos que el $k^{th}$ el usuario especifica un subconjunto cerrado (y, por tanto, compacto) $S_k\subset [0,1]^2$ como una unión de curvas (aquí el cuadrado de la unidad denota la región sobre la que el usuario dibuja la curva). Fije $\epsilon>0$ y considerar la $\epsilon$ -engrosamiento de $S_k$ Este es el conjunto $$ B(S_k,\epsilon):=\{v\in [0,1]^2\colon d(v,S_k)\leq \epsilon\}, $$ donde la notación $d(v,S_k)$ denota la distancia mínima desde un punto en $S_k$ a $v$ con respecto a la distancia euclidiana.
Podemos hacer una media de las funciones indicadoras de estos conjuntos engrosados para obtener una especie de función de "mapa de calor" sobre $[0,1]^2$ dado por $$ f(v)=\frac{\#\{1\leq k\leq N\colon v\in B(S_k,\epsilon)\}}{N}. $$ Es de esperar que converja en el límite (teórico) como $\epsilon\to 0$ y $N\to\infty$ simultáneamente, pero tomando algunas pequeñas $\epsilon$ probablemente sería suficiente (por ejemplo $\epsilon=10^{-3}$ en función del número de personas $N$ y la precisión en coma flotante deseada). Por último, aplique algún tipo de procedimiento de redondeo. Para simplificar las cosas, digamos que una intensidad mayor que $\alpha\in (0,1)$ cuenta como que esa parte de la región está presente. Entonces el conjunto que describe nuestra fuente universal sería $$ S_{universal}:=\{v\in[0,1]^2\colon f(v)>\alpha\}. $$ Desenrollando las definiciones, podríamos escribir esto de la siguiente manera: $$ S_{universal}=\left\{(x,y)\in[0,1]^2\colon \#\bigl\{k\colon \min_{(u,v)\in S_k}\left[(x-u)^2+(y-v)^2\right]\leq \epsilon^2\bigr\}>N\alpha\right\}. $$ Por supuesto, si los conjuntos se dan explícitamente como una unión de curvas (suficientemente simples) como líneas, círculos, curvas de Bézier, el mínimo interior podría calcularse como una función explícita que incluyera raíces cuadradas, raíces cúbicas, etc., y así $S_{universal}$ podría describirse o aproximarse mediante una unión finita de curvas "bonitas".
0 votos
¿Parametrizar ambos por arclength y normalizar para que tengan longitudes iguales? Incluso así obtendrías resultados espantosos. No es por hablar en general, pero promediar es terrible. ¡Salud!
1 votos
@MatthewConroy Lo que con las letras se escribe en diferente cantidad de unión de curvas: la letra I se puede escribir en 1 línea vertical, pero también se pueden añadir 2 líneas horizontales.
0 votos
Sí, eso es un problema. Aún así, se podrían parametrizar todas las curvas de una misma letra a trozos, reparametrizar por longitud de arco y luego promediar tal y como indicas en tu ejemplo. Pero parece que eso daría resultados horribles. ¿Qué se pretende conseguir "promediando" dos letras? ¿Qué características de las dos letras quieres que se mantengan en la media? Tal vez responder a preguntas como éstas ayudaría a determinar la mejor manera de crear un promedio.
2 votos
Hay todo un campo en las matemáticas sobre este tema de
shape matching/analysis
pero tenga en cuenta que los enfoques pueden llegar a ser bastante técnicos. Un posible punto de partida para la lectura es el libro "Shapes and Diffeomorphisms" (2010) de Laurent Younes, Springer Applied Mathematical Sciences vol. 171. Para muchos enfoques es necesario que todas las curvas de una letra sean al menos difeomorfas.0 votos
@MatthewConroy He añadido una imagen para que quede más claro.