Tengo un gran conjunto de datos (decenas de miles de predictores) en el que me gustaría realizar la función de reducción con la intención de mejor construcción de un modelo para la predicción. Profundo de las Redes de Creencia parece abordar el problema de tal manera que producen una salida que guarda cierta semejanza con la de la PCA, es decir, una serie de "virtual" de las dimensiones que pueden ser utilizados para explicar la variación en los datos.
A diferencia de la PCA, sin embargo, parece que cada ejemplo de DBNs seguir el ejemplo original de Hinton, que se utiliza para generar una serie de iniciar pesos para un feed-forward de la red neuronal. Hay una razón por la que nadie parece utilizar apilados Rbm como, por ejemplo, la entrada para la regresión lineal o k-vecino más cercano?