Cuando ajustamos una regresión lineal generalizada (por ejemplo, regresión logística, regresión gamma) estamos estimando la media poblacional de Y dados los predictores $X$ ( es decir, $E(Y | X)$ ).
Cuando ajustamos un modelo de aprendizaje automático, como una RNA, una SVM o un árbol de decisión, ¿se sigue aplicando esta noción? En otras palabras, ¿estamos estimando el valor medio de la población de $Y$ ¿o no es aplicable esa idea y sólo estamos prediciendo "Y"?
ADD Tras la respuesta de Dikran:
I. ¿Qué aspecto de la teoría de un algoritmo de modelización predictiva nos dice que estamos modelizando E(Y|X) frente a sólo Y|X? ¿Es el uso de un término de error que sigue una determinada distribución? Por ejemplo, ¿qué tiene la RNA frente a un árbol de decisión que nos dice que la primera modela E(Y|X) mientras que la segunda está modelando Y|X?
II. ¿Existe alguna relación entre éstos y, por ejemplo, un intervalo de confianza frente a un intervalo de predicción en la regresión lineal?