No estoy seguro de que la clasificación necesariamente haga una declaración sobre la(s) población(es) de la que se extraen los datos. La clasificación, como probablemente sabes, utiliza datos de entrenamiento que consisten en algunos vectores de "características", cada uno etiquetado con una clase específica, para predecir las etiquetas de clase pertenecientes a otros vectores de características no etiquetados. Por ejemplo, podríamos usar los signos vitales de un paciente y el diagnóstico de un médico para predecir si otros pacientes están sanos o enfermos.
Algunos clasificadores, llamados "clasificadores generativos", intentan modelar explícitamente las poblaciones o el proceso generador de datos que produce cada clase. Por ejemplo, el algoritmo Naive Bayes calcula $P(\textrm{clase}=c|\textrm{características})$ para cada clase $c$, asumiendo que las características son todas independientes. Estos modelos podrían razonablemente ser vistos como declaraciones sobre la población.
Sin embargo, otros clasificadores buscan diferencias entre las clases sin modelar las clases mismas; estos se llaman clasificadores discriminativos. Un ejemplo clásico es el clasificador del vecino más cercano, que asigna un ejemplo no etiquetado a la clase de su vecino más cercano (donde cercano se define de alguna manera sensata para el problema). Esto no parece contener mucha, si acaso, información sobre las poblaciones de las que se extrajeron los datos.
Si estás interesado en la diferencia entre estadísticas descriptivas e inferenciales, podría ser más fructífero pensar en el propósito del análisis. Una estadística descriptiva, como la media, podría decirte cuántas truchas hay en un lago típico - describen algo. Una estadística inferencial, como una prueba $t$, podría decirte si típicamente hay más truchas que lobinas en esos lagos - te permite hacer una afirmación sobre una estadística descriptiva.
0 votos
Estadísticas descriptivas: Una moneda fue lanzada diez veces y salió cara seis veces. Inferencia estadística: La estimación de máxima verosimilitud de la probabilidad de que salga cara es $0.6$, o, Esta información es insuficiente para rechazar la hipótesis de que la moneda es justa.
2 votos
Inferencia sin el concepto de "población": Suponga que sus datos son generados por algún mecanismo/ regla aleatoria (parcialmente) desconocido. Los métodos inferenciales permiten evaluar las propiedades de este mecanismo basándose en los datos. Ejemplo: desea verificar una fórmula electrofísica basada en resultados que solo se pueden medir aproximadamente o bajo condiciones imperfectas.
1 votos
@Michael: Sí; o de hecho haz que tus datos sean generados por un mecanismo aleatorio conocido - asignación aleatoria de tratamientos experimentales.