3 votos

Inferencia de máxima entropía para la agrupación de k-means

Estoy tomando un curso sobre Inferencia de Máxima Entropía (MEI), donde se discutió su aplicación a k-Means. Estoy confundido acerca de la configuración del problema.

Por lo que entiendo, nuestro objetivo es encontrar soluciones de agrupación $c(\cdot)$ con un pequeño coste previsto $\mathbb{E}[R^{km}(c)] \le R_{max}$ . Por lo tanto, estamos interesados en el muestreo de una distribución $p^*(c)$ sobre estas soluciones, donde las buenas soluciones tienen una alta probabilidad y las malas, una baja. Para ser lo más "agnósticos" posible, pedimos la distribución que maximiza la entropía, y así obtenemos:

$$ p^*(c) = \arg \max_{p(c)} {H(c)} \quad \text{ s.t. } \mathbb{E}_p[R^{km}(c)] \le R_{max} $$

Obviamente, $c(\cdot)$ son variables aleatorias en este escenario. Pero, ¿cuál es el espacio de probabilidad subyacente? Si $p^*(c')$ es grande, indica que $c$ es una buena solución de agrupación, pero... ¿para qué problema? Es para un conjunto de datos específico $\mathcal{X}$ o para una gran variedad de conjuntos de datos de este tipo? En cualquiera de los casos, ¿en qué parte de las ecuaciones anteriores intervienen estos conjuntos de datos?

EDITAR: Espero no ser demasiado impreciso. Por desgracia, no puedo expresarme con mucha claridad porque no entiendo muy bien el tema. Sin embargo, tal vez pueda responder a preguntas concretas de forma menos ambigua.

1voto

Scott Saad Puntos 8894

Creo que lo he descubierto:

Si $p^*(c')$ es grande, indica que $c$ es una buena solución de agrupación, pero... ¿para qué problema? Es para un conjunto de datos específico $\mathcal{X}$ o para una gran variedad de conjuntos de datos de este tipo?

Es una buena solución con respecto a un conjunto de datos específico $\mathcal{X}$ . Cuanto más pequeño hagamos $R_{max}$ Cuanto menos soluciones sean aceptables. Finalmente, sólo los minimizadores de riesgo empíricos $c^{\bot} \in \arg \min_c \mathcal{R}(c)$ están contenidos en el conjunto.

¿Qué lugar ocupa o ocupan estos conjuntos de datos en las ecuaciones anteriores?

El término $\mathcal{R}(c)$ en la restricción representa el empírico riesgo con respecto a la $\mathcal{X}$ . La expectativa se toma con respecto a la distribución $p(x)$ y no con respecto a alguna distribución sobre los datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X