Una buena aproximación a este tipo de problema puede ser encontrada en la sección 4 del documento de La Bayesiano de Recuperación de Imagen del Sistema, PicHunter por Cox et al (2000). Los datos es un conjunto de enteros resultados A1,...,AN donde N es el número de ensayos. En su caso, hay 3 posibles resultados por prueba. Dejaré Ai ser el índice de la cara que se quedó fuera. La idea es postular un modelo generativo para el resultado dado algunos parámetros del modelo y, a continuación, la estimación de los parámetros por máxima verosimilitud. Si nos muestran las caras (X1,X2,X3) y el participante dice que (X2,X3) son los más similares, entonces el resultado es A=1, con una probabilidad de
p(A=1 | X1,X2,X3)∝exp(−d(X2,X3)/σ)
donde d(X2,X3) es la distancia entre las caras 2 y 3, y σ es un parámetro para la cantidad de "ruido" (es decir, la coherencia de los participantes). Ya que quieres una incrustación en el espacio Euclidiano, la distancia medida sería:
d(x,y)=√∑k(θxk−θyk)2
donde θx el (desconocido) la incorporación de la cara x. Los parámetros de este modelo se θσ, que se puede estimar a partir de los datos a través de máxima verosimilitud. El papel utilizado gradiente de ascenso para encontrar el máximo.
El modelo en el papel era un poco diferente ya que el papel utilizado conocidos atributos de las imágenes para calcular la distancia, en lugar de un desconocido de la incrustación. Para aprender una incrustación tendría que ser mucho mayor conjunto de datos, en el que cada cara se muestra varias veces.
Este modelo básico se supone que todos los ensayos son independientes y todos los participantes son los mismos. Una ventaja de este enfoque es que fácilmente puede adornar el modelo para incluir la no-independencia, el participante efectos, o de otras variables.