Espacio latente es un espacio vectorial abarcado por el variables latentes . Variables latentes son variables que no son directamente observables, pero que son $-$ hasta el nivel de ruido $-$ suficiente para describir los datos. Es decir, el variables observables se puede derivar (calcular) de la latente los.
Permítanme utilizar esta imagen, adaptada de GeeksforGeeks para visualizar la idea:
Cada observable tiene cuatro características visibles: el $x, y,$ y $z$ -coordenadas, y el color. Sin embargo, cada punto está determinado de forma única por un único latente variable, $\varphi$ ( phi
en el código python).
phi = np.linspace(0, 1, 100) # the latent variable
x = phi * np.sin(25 * phi) # 1st observable: x-coordinate
y = np.exp(phi) * np.cos(25 * phi) # 2nd observable: y-coordinate
z = np.sqrt(phi) # 3rd observable: z-coordinate
c = x + y # 4th observable: colour
Esto es, por supuesto, sólo un ejemplo de juguete. En la práctica, a menudo se tienen muchas, incluso millones de variables observables (pensemos en los valores de los píxeles en las imágenes), pero se pueden calcular suficientemente bien a partir de un conjunto mucho más pequeño de variables latentes. En estos casos puede ser útil realizar algún tipo de reducción de la dimensionalidad.
Como ejemplo del mundo real, consideremos los espectros de los objetos que emiten luz, como las estrellas. Un espectro es un largo vector de valores, intensidades de luz en muchas longitudes de onda diferentes. Los espectrómetros modernos miden la intensidad en miles de longitudes de onda. Sin embargo, cada espectro puede describirse bastante bien mediante la temperatura de la estrella (a través de la ley de radiación del cuerpo negro) y la concentración de diferentes elementos (para las líneas de absorción). Es probable que sean mucho menos que miles, tal vez sólo una docena o dos. Eso sería un espacio latente de baja dimensión .
Sin embargo, hay que tener en cuenta que no es necesario que el espacio latente sea más pequeño que el espacio observable. Es totalmente concebible que muchas variables latentes influyan en pocas variables observables. Por ejemplo, el valor de una acción concreta en la bolsa en un momento determinado es un valor único, pero es probable que se deba a muchas influencias que en su mayoría son desconocidas.
En el aprendizaje automático he visto gente que utiliza espacio latente de alta dimensión para denotar un espacio de características inducido por alguna transformación no lineal de los datos que aumenta la dimensionalidad de los mismos. La idea (o la esperanza) es lograr la separabilidad lineal (para la clasificación) o la linealidad (para la regresión) de los datos transformados. Por ejemplo, las máquinas de vectores de apoyo utilizan el truco del núcleo para transformar los datos, pero la transformación es sólo implícita, dada por la función del núcleo. Estos datos son " latente " en el sentido de que usted (o el algoritmo) nunca conoce sus valores; sólo conoce los productos punto de los pares de puntos.