2 votos

cuestión de convergencia uniforme y selección de modelos

Estoy trabajando en la pregunta 1(c) del conjunto de problemas 3 de cs229 . Una captura de pantalla de la pregunta es

enter image description here

No estoy seguro de cómo surgió esta fórmula

\begin{align*} \left|\epsilon(\hat h_j) - \hat \epsilon_{S_{train}}(h_j^*) \right| \le \sqrt{\frac{2}{(1 - \beta) m} \log {\frac{4 \left|\mathcal{H}_j \right|}{\delta}}} \end{align*}

La solución está escrita en https://see.stanford.edu/materials/aimlcs229/ps3_solution.pdf pero sigo sin entender la parte (c). Parece que también hay una errata ya que confunde $\beta$ con $\gamma$ .

La nota de clase correspondiente es https://see.stanford.edu/materials/aimlcs229/cs229-notes4.pdf

1voto

A. G. Puntos 351

Bien, tienes varias preguntas diferentes:

No estoy seguro de cómo surgió esta fórmula.

Se da en la pregunta. Parece que lo han obtenido aplicando el límite de la parte superior de la página 7 del notas .

Sigo sin entender la parte (c).

Hay 2 límites (encontrados en la parte a, y dados para la parte c), cada uno garantizado con probabilidad de $\geq 1-\frac{\delta}{2}$ . Si ambos límites se aplican al mismo tiempo (es decir, la probabilidad de "x" E "y" en este caso) entonces la probabilidad conjunta es $\geq (1-\frac{\delta}{2})(1-\frac{\delta}{2}) > 1-\delta$ .

Y los aplican al mismo tiempo, dando el salto que quieren mostrar.

Parece que también hay una errata ya que confunde $\beta$ con $\gamma$ .

En eso estoy de acuerdo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X