He dedicado mucho tiempo al desarrollo de métodos y software para la validación de modelos predictivos en la tradicional estadística frecuentista de dominio. En poner más Bayesiano de las ideas a la práctica y enseñanza veo algunas diferencias clave a abrazar. En primer lugar, Bayesiano de modelos predictivos pide al analista a pensar muy bien antes de distribuciones que pueden ser personalizados para el candidato características, y estos priores se tire de la modelo hacia ellos (es decir, lograr la contracción/penalización/regularización con diferentes cantidades de penalización por diferentes predictivo características). Segundo, el "real" Bayesiano de manera que no resulte en un modelo único, pero uno se una toda la distribución posterior para una predicción.
Con los Bayesiano características en mente, ¿qué sobreajuste decir? Debemos evaluar? Si es así, ¿cómo? ¿Cómo sabemos cuando un modelo Bayesiano es confiable para uso en el campo? O que es un punto discutible desde la parte posterior llevará a lo largo de toda la precaución-dar incertidumbres cuando se utiliza el modelo que hemos desarrollado para la predicción?
¿Cómo sería la forma de pensar cambio si forzamos a que el modelo Bayesiano para ser destilado a un solo número, por ejemplo, parte posterior de la media/modo/mediana de riesgo?
Veo que algunos relacionados con el pensamiento aquí. Un debate paralelo puede ser encontrado aquí.
Pregunta de seguimiento: : Si estamos completamente Bayesiano y pasar algún tiempo pensando en los priores antes de ver los datos, y nosotros se ajustan a un modelo en el que los datos de probabilidad fue debidamente especificado, estamos obligados a estar satisfechos con nuestro modelo con respecto a sobreajuste? O ¿debemos hacer lo que podemos hacer en el frecuentista mundo donde un tema elegido al azar puede ser predicha bien en el promedio, pero si tenemos que elegir un tema que tiene un muy bajo nivel de predicción o uno con un muy alto valor de predicción habrá de regresión a la media?