Tengo un conjunto de objetos de personas, cada uno con un ID único y posiblemente un nombre no único. Me gustaría seleccionar una cierta cantidad de ellos y garantizar que la muestra no tenga nombres duplicados. Mi problema es que el método ingenuo, de volver a muestrear cualquier nombre duplicado, resulta en que las personas con nombres no únicos tengan una menor probabilidad de ser seleccionadas. ¿Hay alguna manera de hacer esto sin introducir sesgo?
¡Gracias!