Si vas a realizar un argumento asintótico con $n$ cerca de $N$ se necesitan secuencias de poblaciones y muestras finitas. Para cada $m=1,2,3,\dots$ Supongamos que se tiene una población de tamaño $N_m$ y una muestra de tamaño $n_m$ con $N_m\geq n_m$ y $n_m\to\infty$ . Necesitaremos algunas suposiciones sobre las poblaciones; podemos volver a calcular lo que se necesitaba después del argumento
Ya sabemos (bajo supuestos razonables) que si $n_m\to\infty$ tenemos un Teorema Central del Límite, ya sea con $n_m/N_n\to 0$ o con $n_m/N_n\to c\in(0,1)$ . Si $\mu_m$ es la verdadera media de la población finita y $\sigma^2$ es el límite de las verdaderas varianzas de la población, entonces $$\sqrt{n_m}(\bar X_{n_m}-\mu_m)\stackrel{d}{\to} N(0,\sigma^2)$$
Supongamos que $n_m$ es muy grande, para que el número de individuos no muestreados no llegue al infinito. En ese caso, la CLT falla. En el caso extremo, supongamos que $n_m=N_m-1$ para que sólo un individuo no sea muestreado. Podríamos intentar que una media escalada fuera Normal de varias maneras
En primer lugar, podríamos intentar $\sqrt{n_m}(\bar X_{n_m}-\mu_m)$ . Eso no funciona porque sólo hay una diferencia de observación entre $\bar X_{n_m}$ y $\mu_m$ : obtenemos $$\sqrt{n_m}(\bar X_{n_m}-\mu_m)=\sqrt{n_m}\cdot O_p(1/n_m)\stackrel{p}{\to}0$$ Podríamos reescalar e intentar $n_m(\bar X_{n_m}-\mu_m)$ . Eso es del orden correcto, pero es igual $X_{n_m}-\mu$ la única observación no muestreada centrada menos la media verdadera. O podríamos escalar por $\sqrt{N_m-n_m}=1$ la raíz cuadrada del tamaño no muestreado, pero eso va a cero. O escalar el total para obtener $$\frac{N_m}{\sqrt{N_m-n_m}}(\bar X_{n_m}-\mu_m)$$ que es, de nuevo, la observación no muestreada menos la media.
Si $N_m-n_m$ es mayor que uno pero está acotado, se obtiene el mismo tipo de resultado: dependiendo del escalado se infla, se va a cero o se obtiene una suma finita que no converge a Normal.
Sin embargo, si $N_n-n_m\to\infty$ eres bueno. Las observaciones no muestreadas son una suma infinita que entonces sí satisface un CLT, y $$\frac{1}{\sqrt{N_m-n_m}}\left(\sum_{i=1}^{n_m} (X_i-\mu_m)\right)\stackrel{d}{\to}N(0,\sigma^2)$$ así que $$\frac{n_m}{\sqrt{N_m-n_m}}\left(\bar X_{n_m}-\mu_m\right)\stackrel{d}{\to}N(0,\sigma^2)$$
Sin embargo, sigue siendo cierto que $\sqrt{n_m}(\bar X_{n_m}-\mu_m)$ explotará.
Bien, entonces, ¿qué teníamos que asumir? Creo que bastaría con que las varianzas de la población $$\sigma^2_m=\frac{1}{N_m}\sum_{i=1}^{N_m} (X_i-\mu_m)^2$$ convergen a $\sigma^2$ y que los terceros momentos absolutos de la población $$\kappa_m=\frac{1}{N_m}\sum_{i=1}^{N_m} |X_i-\mu_m|^3$$ están acotados. Esta podría ser la suposición, o podríamos tratar las poblaciones como generadas aleatoriamente y hacer suposiciones sobre el proceso de generación de datos que obliga a que estos se mantengan con probabilidad uno.