Estoy leyendo Elementos de Aprendizaje Estadístico (2ª edición, 12ª impresión) y hay dos cosas que me preocupan.
En cuanto a la ecuación 2.25, una es el conjunto de entrenamiento . Supongo que es una función de dos variables aleatorias X e Y, por lo que al calcular el valor esperado, ¿la función de densidad de probabilidad subyacente sería la distribución conjunta de X e Y?
Otra cosa es si debo interpretar y0-hat como una constante o como una variable aleatoria. Sé que es una estimación del punto de entrada de la prueba. Si y0-hat es una variable aleatoria, ¿cuál sería la distribución de probabilidad subyacente?
Entiendo la derivación de la descomposición del error medio cuadrático en varianza y sesgo, pero cuando miro Var(y0-hat), no puedo evitar pensar que y0-hat es una constante y, por tanto, Var(y0-hat) = 0. ¿Qué hay de malo en mi pensamiento?
Una confusión similar surge para el error de predicción esperado (ecuación 2.27), donde el valor esperado se calcula con respecto a y0|x0, lo que me parece que y0 es una variable aleatoria y x0 un evento.
Lo siento, no sé cómo formatear. Disculpen si esto ya fue publicado. Cualquier ayuda será muy apreciada.