Wikipedia define una muestra como:
un subconjunto de una población.
Mientras exploramos la razón por la que dividimos por $(n-1)$ en lugar de $n$ cuando se calcula la desviación estándar (que se discute en esta pregunta ), me encontré con este PDF demostrando por qué $(n-1)$ es mejor.
Al enumerar todas las muestras posibles de $n=2$ de una población de tres tarjetas numeradas 0, 2 y 4, incluye las muestras (0,0), (2,2) y (4,4). Me cuesta conciliar esto con la definición de muestra que creía conocer (y que da la Wikipedia).
Una muestra de 2 naipes de una población de 52 no incluiría el Tres de Corazones dos veces, ¿verdad? Del mismo modo, supongo que una encuesta sobre una muestra de votantes no incluiría al mismo votante varias veces.
Otras fuentes respaldan el método descrito en el PDF. ¿Qué es lo que no entiendo?