Muestra de nombres sin duplicados, sin introducir sesgo

Question

Muestra de nombres sin duplicados, sin introducir sesgo

Preguntado el 12 de Octubre, 2022: Cuando se hizo la pregunta
53 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo un conjunto de objetos de personas, cada uno con un ID único y posiblemente un nombre no único. Me gustaría seleccionar una cierta cantidad de ellos y garantizar que la muestra no tenga nombres duplicados. Mi problema es que el método ingenuo, de volver a muestrear cualquier nombre duplicado, resulta en que las personas con nombres no únicos tengan una menor probabilidad de ser seleccionadas. ¿Hay alguna manera de hacer esto sin introducir sesgo?

¡Gracias!

Preguntado el 12 de Octubre, 2022 por Marin Boyanov Takanov

Answer 1

1 Respuestas

Answer 2

2voto

icelava Puntos 548

Cualquier método que utilices si deseas garantizar nombres no duplicados resultará en que personas con nombres menos comunes tengan una probabilidad más alta de ser muestreadas.

Como experimento mental, supongamos que quieres muestrear $k$ objetos de $n$, pero solo hay $k nombres, por lo que cada nombre debe ser muestreado exactamente una vez. De estos, $k-1$ nombres ocurren $m\geq 2$ veces cada uno, y el nombre número $k$ ocurre solo una vez. (Entonces $n=m(k-1)+1$.) Entonces, cada objeto con un nombre duplicado tiene una probabilidad de $\frac{1}{m}$ de ser muestreado (porque es miembro de un grupo de tamaño $m$, del cual debe ser muestreado uno, ya que debemos elegir un miembro de cada "grupo de nombres"), y el objeto único con un nombre no duplicado será elegido con certeza, es decir, con probabilidad $1$.

Respondido el 12 de Octubre, 2022 por icelava (548 Puntos )

Muestra de nombres sin duplicados, sin introducir sesgo

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Muestra de nombres sin duplicados, sin introducir sesgo

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: