8 votos

La minimización de Lagrange con dos funciones

He leído este problema donde tengo que minimizar un funcional $E[L]$ utilizando el cálculo de variaciones, pero no estoy seguro de cuál es el procedimiento a seguir.

El funcional es la pérdida esperada:

$$E[L] = \int\int L(t, y(x))p(x,t)dxdt $$

y queremos elegir un $y(x)$ a minimizar $E[L]$ con el fin de obtener el siguiente resultado con" $L = (y(x) - t)^2$

$$y(x) = \frac{\int tp(x,t)dt}{p(x)}$$

pero, al hacerlo, creo que es ignorar la variación en $p(x,t)$. ¿Cuál es la correcta de Lagrange para este funcional y de cómo proceder con la minimización cuando hay una integración adicional (en este caso) en $t$.

Por cierto, yo estoy acostumbrado a ver Lagragians en la forma $L(q(t), q'(t),t)$ donde $t$ es la variable independiente y obtenemos algo a lo largo de las líneas de (informalmente):

$$\delta \displaystyle \int L(q(t), q'(t),t) dt= \displaystyle \int\left(\displaystyle \frac{ \partial L}{\partial q}\delta q + \displaystyle \frac{\partial L }{\partial q'}\delta q'\right) dt$$

Una pregunta adicional: ¿por Qué estamos usando una integral doble en la pérdida esperada? Pensando en términos discretos, el equivalente sería:

$$E[L] = \sum_{i} \sum_{j} (y(x_{i}) - t_{j})^{2}p(x_{i},t_{j})$$

que parece un poco extraño en el contexto de una regresión, ya que estamos teniendo en la cuenta de la cruz términos, ¿verdad? Por lo tanto, supongo que en algún momento se requiere una distancia mínima, por ejemplo, desde un punto de $y(x_{2})$$t_{1}$.

ACTUALIZACIÓN:

He encontrado este artículo en el cual hay una minimización en el uso de diferentes funcional, pero no explicó por qué se omite $p(x)$.

Gracias de antemano!

2voto

theog Puntos 585

A pesar de las apariencias, esto es realmente una unidimensional variacional del problema. El desconocido $y$ es sólo una función de $x$, de modo que podemos tratar a la integral en $t$ como una "caja negra", es decir, sólo algunas ordinario de la función $F(x,y) := \int L(t,y)p(x,t)\,\mathrm dt$. Entonces tu funcional se convierte en $$E[L]=\iint L\big(t,y(x)\big)p(x,t)\,\mathrm dx\,\mathrm dt=\int F\big(x,y(x)\big)\,\mathrm dx,$$ y se puede aplicar la costumbre de Euler-Lagrange ecuación en $x$$y(x)$.

En este caso concreto, podemos escribir $F$ señalan explícitamente. Observar que $$L(t,y)p(x,t)=(y-t)^2p(x,t)=y^2p(x,t)-2typ(x,t)+t^2p(x,t),$$ así $$F(x,y)=\int L(t,y)p(x,t)\,\mathrm dt=y^2\int p(x,t)\,\mathrm dt-2y\int tp(x,t)\,\mathrm dt+\int t^2p(x,t)\,\mathrm dt\\=y^2q(x)-2yr(x)+s(x),$$ donde $q(x)=\int p(x,t)\,\mathrm dt$, $r(x)=\int tp(x,t)\,\mathrm dt$, y $s(x)=\int t^2p(x,t)\,\mathrm dt$.


Diablos, $F\big(x,y(x)\big)$ no implican ningún derivados de $y$, por lo que no necesitamos ni cualquier cálculo variacional. El valor de $F\big(x,y(x)\big)$ en cualquier punto de $x$ es independiente del valor de $y$ en cualquier otro punto, por lo que sólo puede elegir $y(x)$ en cada una de las $x$ independientemente de minimizar $F\big(x,y(x)\big)$ en ese punto. Es decir, cuando usted encuentra a $y(1)$ a minimizar $F\big(1,y(1)\big)$, usted no tiene que preocuparse acerca de lo $y(2)$ o $y(1.1)$ o $y(42)$ va a ser. Que hace las cosas muy fáciles: $$\frac{\partial}{\partial y}F(x,y)=2yq(x)-2r(x)=0\implies y=\frac{r(x)}{q(x)}=\frac{\int tp(x,t)\,\mathrm dt}{\int p(x,t)\,\mathrm dt}.$$


De todos modos, supongo que lo que realmente quiere entender que es lo que el objetivo original $E[L]=\iint \big(y(x)-t\big)^2p(x,t)\,\mathrm dx\,\mathrm dt$ es todo acerca de. Bueno, claramente el plazo $L(t,y)=\big(y(x)-t\big)^2$ dice que desea $y(x)-t$ a de ser pequeña, es decir, desea $y(x)$ estar cerca de $t$. Pero $t$ podría ser cualquier cosa, mientras que $y$ sólo depende de $x$! Entonces, ¿cómo podemos esperar obtener $y(x)$ estar cerca de $t$, lo $t$ podría ser? La clave es que para cualquier $x$, algunos valores de $t$ son más propensos que otros - que es lo $p(x,t)$ dice usted. Así que si usted sabe el valor de $x$, entonces usted sabe lo que los valores de $t$ son más propensos a que $x$, y usted puede recoger $y(x)$ a estar en algún lugar en el medio de esos valores.

Eso es todo lo que realmente está pasando aquí. No creo que el $p(x,t)$'s "entre los términos", piensa en ellos como el peso en un promedio ponderado (o una regresión ponderada, tal vez). Después de todo, el valor óptimo de $y(x)$ resulta no ser nada, pero el valor esperado de $t$ condicionado a $x$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X