Dado un muy amplio conjunto de datos, si nuestro objetivo es hacer inferencia probabilística, ¿cuáles son las principales ventajas del aprendizaje de una red Bayesiana a partir de los datos y, a continuación, utilizar la red Bayesiana para calcular probabilidades condicionales? Veo que también podríamos aproximar estas probabilidades directamente desde el conjunto de datos de conteo. Además, si el conjunto de datos es lo suficientemente grande, también se podría tratar de usar la CLT/WLLN para calcular los intervalos de confianza. ¿Por qué sería mejor para la construcción de una red Bayesiana (duro problema de optimización) y hacer inferencia (paso de mensajes algoritmos)? Algún tipo de sobre-ajuste argumento?
Gracias!