2 votos

Distribución predictiva: ¿Qué podemos decir de la predicción?

Me pregunto qué más podríamos obtener de la distribución predictiva. Demos un conjunto de datos, digamos $\mathcal{D}=\{(x_i,y_i)\}$ queremos predecir el valor s $Y_{new}$ en nuevas ubicaciones, digamos $X_{new}$ .

Supongamos que tenemos la distribución predictiva $$ Y_{new}|X_{new}, \mathcal{D} \sim p(Y_{new}|X_{new}, \mathcal{D}). $$ Entonces, ¿cuál es nuestra predicción en $X_{new}$ ? Si necesitamos una predicción determinista, ¿se utiliza la media, es decir $$ \text{The prediction at } X_{new} = E[Y_{new}|X_{new},\mathcal{D}] ? $$

Cualquier comentario o respuesta será muy apreciado. Gracias.

4voto

icelava Puntos 548

En estadística La parte del ejercicio de predicción termina cuando se obtiene una distribución predictiva. Por cierto, se trata de un perfecto punto final - mucho mejor que una predicción puntual.

Lo que sigue después de dar su distribución predictiva es el decisión que alguien hará basándose en su distribución predictiva. Sin embargo, en las decisiones no sólo interviene su distribución: costes de las decisiones "equivocadas", costes de las decisiones "correctas", grado de "acierto" o "error" de una decisión, etcétera. Estos elementos suelen incluirse en funciones de pérdida y la tarea del responsable de la toma de decisiones es minimizar la pérdida basándose en su $\mathcal{D}$ y la estructura de costes.

A veces la "decisión" no es más que un resumen numérico de $\mathcal{D}$ y se puede suponer que la pérdida es proporcional a la diferencia al cuadrado entre la decisión y el resultado real. Si es así, la decisión óptima es la que minimiza el error cuadrático esperado. Entonces la decisión óptima es la expectativa de $\mathcal{D}$ .

O la pérdida puede ser proporcional a la diferencia absoluta entre este resumen de un número y el resultado real. Entonces la decisión óptima sería la mediana de $\mathcal{D}$ que minimiza el error absoluto esperado .

En resumen: una predicción puntual no tiene sentido sin tener en cuenta el coste o la función de pérdida que pretende minimizar. En cambio, una densidad de predicción puede establecerse (y evaluarse mediante reglas de puntuación ) incluso sin dichos costes.

Ya he escrito antes sobre temas similares, normalmente robando descaradamente de Frank Harrell y su blog por ejemplo: ¿Por qué utilizar una determinada medida del error de previsión (por ejemplo, MAD) en lugar de otra (por ejemplo, MSE)?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X