Tradicionalmente, la inferencia estadística se enseña en el contexto de las muestras de probabilidad y la naturaleza del error de muestreo. Este modelo es la base de la prueba de significación. Sin embargo, hay otras formas de modelar las desviaciones sistemáticas del azar y resulta que nuestras pruebas paramétricas (basadas en el muestreo) suelen ser buenas aproximaciones a estas alternativas.
Las pruebas paramétricas de hipótesis se basan en la teoría del muestreo para producir estimaciones del error probable. Si se toma una muestra de un tamaño determinado de una población, el conocimiento de la naturaleza sistemática sistemática del muestreo hace que las pruebas y los intervalos de confianza tengan sentido. Con una población, la teoría del muestreo simplemente no es relevante y las pruebas no tienen sentido en el sentido tradicional. La inferencia es inútil, no hay nada que inferir, sólo existe la cosa... el parámetro en sí.
Algunos lo sortean apelando a las superpoblaciones que representa el censo actual. Me parece que estas apelaciones no son convincentes: las pruebas paramétricas se basan en el muestreo probabilístico y sus características. Una población en un momento dado puede ser una muestra de una población mayor a lo largo del tiempo y del lugar. Sin embargo, no veo ninguna manera de poder argumentar legítimamente que se trata de una muestra aleatoria (o, más generalmente, de cualquier forma de probabilidad). Sin una muestra probabilística, la teoría del muestreo y la la teoría del muestreo y la lógica tradicional de las pruebas simplemente no se aplican. También se puede hacer una prueba sobre la base de una muestra de conveniencia.
Está claro que para aceptar las pruebas cuando se utiliza una población, tenemos que prescindir de la base de esas pruebas en los procedimientos de muestreo. Una forma de hacerlo es reconocer la estrecha conexión entre nuestras pruebas teóricas de la muestra -como t, Z y F- y los procedimientos de aleatorización. Las pruebas de aleatorización se basan en la muestra que tenemos a mano. Si recojo datos sobre los ingresos de hombres y mujeres, el modelo de probabilidad y la base de nuestras estimaciones de error son asignaciones aleatorias repetidas de los valores de los datos reales. Podría comparar las diferencias observadas entre los grupos con una distribución basada en esta aleatorización. (Por cierto, hacemos esto todo el tiempo en los experimentos, donde el muestreo aleatorio de un modelo de población rara vez es apropiado).
Ahora bien, resulta que las pruebas teóricas de la muestra son a menudo buenas aproximaciones de las pruebas de aleatorización. Así que, en última instancia, creo que las pruebas a partir de poblaciones son útiles y significativas dentro de este marco y pueden ayudar a distinguir la variación sistemática de la aleatoria, al igual que con las pruebas basadas en muestras. La lógica utilizada para llegar a este punto es un poco diferente, pero no afecta mucho al significado práctico y al uso de las pruebas. Por supuesto, podría ser mejor utilizar directamente las pruebas de aleatorización y permutación, ya que están fácilmente disponibles con toda nuestra potencia informática moderna.