Puede ser cualquiera de los dos (o ambos), pero en la práctica, las columnas de la matriz de nivel uno son los valores predichos (no las etiquetas de clase) para cada alumno base.
Nota al margen: tenga en cuenta que, a menos que el modelo se calibre utilizando algo como la escala de Platt, el resultado de un modelo de clasificación no será una "probabilidad", sino un valor numérico predicho. A menudo se supone que es, o se hace referencia a ella, como una probabilidad porque el valor está entre 0 y 1.
- En la regresión, es simplemente el valor predicho.
- En la clasificación binaria, es el valor predicho para la clase positiva. En teoría, para cada alumno base, se podrían añadir ambas columnas (valor predicho para la clase negativa y valor predicho para la clase positiva) a la matriz de nivel uno, pero la mayoría de las implementaciones de apilamiento (por ejemplo Conjunto apilado H2O , SuperLearner ) utilice sólo el valor predicho para la clase positiva.
- En la clasificación multiclase, suele ser el conjunto de valores predichos para todas las clases. En otras palabras, si tiene 5 alumnos base y 3 clases, el número de columnas en la matriz de nivel uno será 5*3=15, más la columna de respuesta.