3 votos

Apilamiento de modelos, ¿cuál es la entrada del metaclasificador?

Sé que al apilar diferentes modelos entre los que hay una baja correlación se puede potenciar el rendimiento de un solo modelo. Y he encontrado una imagen enter image description here

En el paso 7, el $h_j(x_i)$ en los nuevos datos $x_i^{'}=\{h_1(x_i), h_2(x_i), ..., h_T(x_i)\}$ es la etiqueta de clase de salida o la probabilidad del modelo $j$ ?

2voto

Erin LeDell Puntos 156

Puede ser cualquiera de los dos (o ambos), pero en la práctica, las columnas de la matriz de nivel uno son los valores predichos (no las etiquetas de clase) para cada alumno base.

Nota al margen: tenga en cuenta que, a menos que el modelo se calibre utilizando algo como la escala de Platt, el resultado de un modelo de clasificación no será una "probabilidad", sino un valor numérico predicho. A menudo se supone que es, o se hace referencia a ella, como una probabilidad porque el valor está entre 0 y 1.

  • En la regresión, es simplemente el valor predicho.
  • En la clasificación binaria, es el valor predicho para la clase positiva. En teoría, para cada alumno base, se podrían añadir ambas columnas (valor predicho para la clase negativa y valor predicho para la clase positiva) a la matriz de nivel uno, pero la mayoría de las implementaciones de apilamiento (por ejemplo Conjunto apilado H2O , SuperLearner ) utilice sólo el valor predicho para la clase positiva.
  • En la clasificación multiclase, suele ser el conjunto de valores predichos para todas las clases. En otras palabras, si tiene 5 alumnos base y 3 clases, el número de columnas en la matriz de nivel uno será 5*3=15, más la columna de respuesta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X