116 votos

Fundamentos de la integral de Lebesgue

Tengo problemas para encontrar una buena explicación de la integral de Lebesgue. Según la definición, es la expectativa de una variable aleatoria. Entonces, ¿cómo se modela el área bajo la curva? Tomemos por ejemplo una función $f(x) = x^2$ . ¿Cómo encontramos la integral de $f(x)$ en $[0,1]$ utilizando la integral de Lebesgue?

11 votos

¿Qué definición da "la expectativa de una variable aleatoria"? ¿Qué libro lo hace?

0 votos

¿Puede indicarme una fuente que lo explique mejor con algunos ejemplos?

0 votos

La variable aleatoria es la altura de la curva.

216voto

Lorin Hochstein Puntos 11816

Como se ha señalado, la definición habitual de la integral de Lebesgue tiene poco que ver con la probabilidad o las variables aleatorias (aunque las nociones de teoría de la medida y de la integral pueden aplicarse entonces al ámbito de la probabilidad, donde bajo interpretaciones adecuadas resultará que la integral (de Lebesgue) de (ciertas) funciones corresponde a la expectativa de (ciertas) variables aleatorias).

Pero este no es el origen de la integral de Lebesgue. He aquí una idea intuitiva de lo que es la integral de Lebesgue, en comparación con la integral de Riemann.

Recordemos la idea de la integral de Riemann: la integral $\int_a^b f(x)\,dx$ se supone que representa el área neta firmada entre el $x$ -el gráfico de $y=f(x)$ y las líneas $x=a$ y $x=b$ . La forma en que intentamos hacerlo es dividiendo el dominio, $[a,b]$ en subintervalos $[a=x_0,x_1]$ , $[x_1,x_2],\ldots,[x_{n-1},x_n=b]$ . Entonces, en cada subintervalo $[x_i,x_{i+1}]$ elegimos un punto $x_i^*$ y estimamos el área bajo la gráfica de la función con el rectángulo de altura $f(x_i^*)$ y la base $[x_i,x_{i+1}]$ . Esto nos lleva a las sumas de Riemann $$ \sum_{i=0}^{n-1} f(x_i^*)(x_{i+1}-x_i)$$ como estimaciones del área bajo el gráfico. A continuación, consideramos particiones cada vez más finas de $[a,b]$ y tomar los límites para estimar el área.

La idea de Lebesgue era que en lugar de dividir el dominio, dividiremos el gama si la función toma valores entre $c$ y $d$ podemos dividir el rango $[c,d]$ en subintervalos $[c=y_0,y_1]$ , $[y_1,y_2],\ldots,[y_{m-1},y_m=d]$ . Entonces, dejamos que $E_i$ sea el conjunto de todos los puntos de $[a,b]$ cuyo valor bajo $f$ se encuentra entre $y_i$ y $y_{i+1}$ . Es decir, $$ E_i = f^{-1}([y_i,y_{i+1}]) = \{ x\in[a,b]\,|\, y_i \leq f(x) \leq y_{i+1}\}.$$

Si tenemos una forma de asignar un "tamaño" a $E_i$ Llama a su "medida" $\mu(E_i)$ entonces la parte de la gráfica de $y=f(x)$ que se encuentra entre las líneas horizontales $y=y_i$ y $y=y_{i+1}$ será $A$ , donde, $$ y_i\mu(E_i) \leq A \leq y_{i+1}\mu(E_i).$$ Así que Lebesgue sugiere aproximar el área escogiendo un número $y_i^*$ entre $y_i$ y $y_{i+1}$ y considerando las sumas $$ \sum_{i=0}^{n-1} \mu(E_i)y_i^*.$$ A continuación, considere particiones cada vez más finas de $[c,d]$ y esto da aproximaciones cada vez más finas del área por estas sumas. La integral de Lebesgue será el límite de estas sumas. (La analogía dada por Mike Spivey es muy adecuada para la distinción entre la partición del dominio y la partición del área para encontrar la suma).

Pero para que esto tenga sentido, necesitamos desarrollar una forma de medir subconjuntos bastante intrincados de la línea, para poder calcular $\mu(E_i)$ . Así que primero desarrollamos una forma de hacerlo; resulta que si se acepta el Axioma de la Elección, entonces es imposible idear una forma de medir que (i) asigne a un intervalo $[a,b]$ la "medida" $b-a$ ii) será invariante por traslación, de modo que si $F=E+c = \{e+c | e\in E\}$ entonces $\mu(F)=\mu(E)$ (iii) será contablemente aditivo: si $E = \cup_{i=1}^{\infty}E_i$ y el $E_i$ son disjuntos, entonces $\mu(E) = \sum\mu(E_i)$ ; y (iv) cada subconjunto de la línea tendrá una medida bien definida (posiblemente infinita). (Si no se acepta el axioma de elección, entonces hay modelos de los reales en los que puede conseguirlo). Así que se elimina la restricción (iv), y se construye una medida para la que algunos conjuntos serán "demasiado raros" para tener una medida. Entonces restringimos la atención a ciertos tipos de funciones (llamadas funciones medibles), que son aquellas para las que los conjuntos que obtenemos en el proceso descrito anteriormente son todos conjuntos medibles. Y entonces definimos la integral de Lebesgue para esas funciones, siguiendo la idea descrita anteriormente (pero no se define exactamente así, sino que la forma habitual es describir $f$ como límite de funciones para las que la integral es fácil, y luego calcular la integral de $f$ como límite de las integrales que son fáciles).

Para su función, $f(x)=x^2$ es bastante fácil: todos los valores se encuentran entre $0$ y $1$ por lo que digamos que dividimos el rango en subintervalos de longitud $1/n$ Así que $y_i = i/n$ , $i=0,\ldots,n$ . Entonces $$f^{-1}([y_i,y_{i+1}]) = f^{-1}([i/n, (i+1)/n]) = [\sqrt{i/n},\sqrt{(i+1)/n}],$$ por lo que el $n$ estimación, eligiendo $y_i^* = y_i = i/n$ es sólo $$\sum_{i=0}^n (i/n)\left(\sqrt{(i+1)/n} - \sqrt{i/n}\right).$$ Tome el límite como $n\to\infty$ y obtendrá que el límite es $\frac{1}{3}$ como era de esperar. (Me ahorraré los detalles; véase el final de esta respuesta para una forma de obtener la respuesta de forma similar a como se hace con la integral de Riemann).

Resulta que no todas las funciones son Lebesgue-integrables, al igual que no todas las funciones son Riemann-integrables. Pero toda función que sea Riemann-integrable también sea integrable en Lebesgue, y el valor de su integral de Lebesgue será el mismo que el de su integral de Riemann. Pero hay funciones que son no Riemann-integrable pero son Lebesgue-integrable (por ejemplo, la función característica de los racionales es Lebesgue-integrable, con integral $0$ sobre cualquier intervalo, pero no es integrable en Riemann). También tenemos un "Teorema fundamental del cálculo" para la integral de Lebesgue:

Teorema. Si $F$ es una función diferenciable, y la derivada $F'$ está acotado en el intervalo $[a,b]$ entonces $F'$ es integrable por Lebesgue en $[a,b]$ y $$\int_a^x F'\,d\mu = F(x) - F(a).$$

Aquí, la integral es la integral de Lebesgue.

En particular, para finalmente responder a la pregunta que hace sobre su ejemplo, ya que $F(x)=\frac{x^3}{3}$ es una función diferenciable cuya derivada está acotada en cualquier intervalo finito, en particular en $[0,1]$ entonces de este teorema se puede deducir que la integral sobre el intervalo $[0,1]$ de la derivada $F'(x)=x^2$ es igual a $F(1)-F(0)$ eso es, $$\int_0^1 x^2\,d\mu = \int_0^1 \left(\frac{x^3}{3}\right)'\,d\mu = \frac{1}{3} - \frac{0}{3} =\frac{1}{3}.$$

Recomiendo el libro Un jardín de integrales de Frank E. Burk (Dolciani Mathematical Expositions 31, MAA, 2007, ISBN 9-780883-853375); analiza y compara la integral de Cauchy, la integral de Riemann, la integral de Riemann-Stieltjes, la integral de Lebesgue, la integral de Lebesgue-Stieltjes y la integral de Henstock-Kurzweil; también analiza las integrales de Wiener y Feynman. He terminado de leerlo hace poco.

5 votos

Bien dicho, Arturo.

1 votos

@Mike: Gracias; a mí también me gusta la analogía que das.

1 votos

Gracias. Me gustaría poder decir que la analogía es original. :)

39voto

Martin OConnor Puntos 116

Uno de mis profesores de posgrado, Erhan Cinlar, solía hacer la siguiente analogía para explicar la diferencia intuitiva entre la integral de Lebesgue y la integral de Riemann.

Supón que tienes un montón de monedas de diferentes denominaciones y quieres saber cuánto dinero tienes. La integral de Riemann es como recoger las monedas, una por una, y sumar la denominación de cada una a un total acumulado. La integral de Lebesgue es como ordenar primero las monedas por su denominación, y luego obtener el total multiplicando cada denominación por cuántas tienes de esa denominación y luego sumar esos números. Los métodos son diferentes, pero se obtiene el mismo resultado por cualquiera de ellos.

Del mismo modo, cuando se definen tanto la integral de Riemann como la integral de Lebesgue, dan el mismo valor. Sin embargo, como han dicho otros, hay funciones para las que la integral de Lebesgue está definida pero la integral de Riemann no, por lo que en ese sentido la integral de Lebesgue es más general que la de Riemann.

12 votos

Una forma de ver tu analogía en el contexto de las integrales es notar que las integrales de Rieman aproximan el área mediante sumas de rectángulos verticales, mientras que la integral de Lebesgue utiliza en cambio rectángulos horizontales...

9 votos

@Mariano: O bien, tienes un montón de montones de monedas. Riemann cuenta cada montón por separado y luego suma los totales. Lebesgue cuenta cuántos centavos hay en todos los montones, y obtiene un total parcial; luego cuenta cuántas monedas de cinco centavos; luego cuántas de diez centavos; etc. Y luego suma los totales

19 votos

Esta analogía fue dada por el propio Lebesgue (según Dunham, The Calculus Gallery).

10voto

Dillie-O Puntos 193

La integral de Lebesgue es una generalización de la habitual integral de Riemann que se enseña en el cálculo básico. Si la integral de Riemann de una función sobre un conjunto existe, entonces es igual a la integral de Lebesgue. Así, la integral de Lebesgue de $x^2$ en $[0,1]$ es sólo el viejo $(1/3) 1^3-(1/3)0^3$

La integral de Lebesgue tiene la ventaja de estar definida para muchas más funciones que la integral de Riemann. Y lo que es más importante, la integral de Lebesgue tiene útiles propiedades de límite:

La expectativa de una variable aleatoria es una aplicación particular de la integral de Lebesgue donde la función a integrar es la variable aleatoria (vista como una función en el espacio muestral) y la integración es con respecto a una medida de probabilidad.

Tienes que mirar uno de los muchos libros de probabilidad y medida para conocer los detalles. Mis favoritos son:

  • Pollard, Guía del usuario de la probabilidad teórica de la medida
  • Dudley, Análisis real y probabilidad

Terence Tao tiene algunos apuntes de conferencias en línea:

5voto

Jedi Master Spooky Puntos 2374

La integral de Riemann es bastante buena y muy intuitiva, sin embargo la principal razón para considerar otros tipos de integrales es que "el espacio de funciones que son integrables de Riemann", digamos $R(I)$ donde $I\subset\mathbb{R}^n$ es compacto, es demasiado pequeño (aunque es un espacio lineal en el sentido de que se pueden sumar y multiplicar por constantes).

Si sólo miras una función continua a trozos que desaparece fuera de una región acotada y entonces puedes seguir con la integral de Riemann. En el análisis matemático, observamos varios tipos de límites de funciones y nos gustaría que las funciones límite permanecieran en "el espacio" (queremos que el espacio sea completo).

Lo mejor que podemos hacer en el caso de Riemann es buscar secuencias uniformemente convergentes $f_n$ en un intervalo compacto $I\subset\mathbb{R}^n$ - en ese caso el límite $\lim f_n\in R(I)$ y $\lim\int f_n =\int \lim f_n$ . Sin embargo, ¡la convergencia uniforme es muy rara! (Muchas series de Fourier no son continuas aunque sus sumas parciales lo sean, etc.).

La integral de Lebesgue se puede construir de varias maneras (aunque terminando con el mismo espacio). Un primer intento podría ser comenzar con la normalización $R(I)$ , $\|f\|=\int|f|$ y entonces obtendríamos una distancia entre $f,g\in R(I)$ por $\|f-g\|$ y así obtenemos un espacio métrico que podemos completar añadiendo todos los límites posibles; sin embargo, esto no funcionará porque aunque $R(I)$ es pequeño es a grande (hay funciones no limitadas tales que $\|f\|=\infty$ ). Un mejor comienzo sería mirar $C(I)$ = el espacio de las funciones continuas sobre (el conjunto compacto) $I$ (ciertamente cada $f\in R(I)$ es un límite puntual de $C(I)$ funciones) si normamos $C(I)$ de la misma manera obtendríamos efectivamente un espacio normado y la terminación de ese espacio es $L^1(I)$ .

En $L^1$ seguro que puedes tomar límites en norma y además, como ya se ha señalado en otras respuestas, tienes muchos otros teoremas de límites mejores como el teorema de Lebesgue dominado o el teorema de convergencia monótona. Además, las funciones acotadas de $R(I)$ pertenecen a $L^1(I)$ .


Además de lo anterior: Para que la norma sugerida sea una norma tenemos que considerar dos funciones, $f$ y $g$ , como igual siempre que $\int|f-g|dx=0$ que, por ejemplo, ocurre cuando su valor difiere en algún punto de $I$ .

5voto

Vin Puntos 3945

Puede considerar las siguientes fuentes:

1 votos

¿No debería publicar las referencias como comentarios?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X