Como se ha señalado, la definición habitual de la integral de Lebesgue tiene poco que ver con la probabilidad o las variables aleatorias (aunque las nociones de teoría de la medida y de la integral pueden aplicarse entonces al ámbito de la probabilidad, donde bajo interpretaciones adecuadas resultará que la integral (de Lebesgue) de (ciertas) funciones corresponde a la expectativa de (ciertas) variables aleatorias).
Pero este no es el origen de la integral de Lebesgue. He aquí una idea intuitiva de lo que es la integral de Lebesgue, en comparación con la integral de Riemann.
Recordemos la idea de la integral de Riemann: la integral $\int_a^b f(x)\,dx$ se supone que representa el área neta firmada entre el $x$ -el gráfico de $y=f(x)$ y las líneas $x=a$ y $x=b$ . La forma en que intentamos hacerlo es dividiendo el dominio, $[a,b]$ en subintervalos $[a=x_0,x_1]$ , $[x_1,x_2],\ldots,[x_{n-1},x_n=b]$ . Entonces, en cada subintervalo $[x_i,x_{i+1}]$ elegimos un punto $x_i^*$ y estimamos el área bajo la gráfica de la función con el rectángulo de altura $f(x_i^*)$ y la base $[x_i,x_{i+1}]$ . Esto nos lleva a las sumas de Riemann $$ \sum_{i=0}^{n-1} f(x_i^*)(x_{i+1}-x_i)$$ como estimaciones del área bajo el gráfico. A continuación, consideramos particiones cada vez más finas de $[a,b]$ y tomar los límites para estimar el área.
La idea de Lebesgue era que en lugar de dividir el dominio, dividiremos el gama si la función toma valores entre $c$ y $d$ podemos dividir el rango $[c,d]$ en subintervalos $[c=y_0,y_1]$ , $[y_1,y_2],\ldots,[y_{m-1},y_m=d]$ . Entonces, dejamos que $E_i$ sea el conjunto de todos los puntos de $[a,b]$ cuyo valor bajo $f$ se encuentra entre $y_i$ y $y_{i+1}$ . Es decir, $$ E_i = f^{-1}([y_i,y_{i+1}]) = \{ x\in[a,b]\,|\, y_i \leq f(x) \leq y_{i+1}\}.$$
Si tenemos una forma de asignar un "tamaño" a $E_i$ Llama a su "medida" $\mu(E_i)$ entonces la parte de la gráfica de $y=f(x)$ que se encuentra entre las líneas horizontales $y=y_i$ y $y=y_{i+1}$ será $A$ , donde, $$ y_i\mu(E_i) \leq A \leq y_{i+1}\mu(E_i).$$ Así que Lebesgue sugiere aproximar el área escogiendo un número $y_i^*$ entre $y_i$ y $y_{i+1}$ y considerando las sumas $$ \sum_{i=0}^{n-1} \mu(E_i)y_i^*.$$ A continuación, considere particiones cada vez más finas de $[c,d]$ y esto da aproximaciones cada vez más finas del área por estas sumas. La integral de Lebesgue será el límite de estas sumas. (La analogía dada por Mike Spivey es muy adecuada para la distinción entre la partición del dominio y la partición del área para encontrar la suma).
Pero para que esto tenga sentido, necesitamos desarrollar una forma de medir subconjuntos bastante intrincados de la línea, para poder calcular $\mu(E_i)$ . Así que primero desarrollamos una forma de hacerlo; resulta que si se acepta el Axioma de la Elección, entonces es imposible idear una forma de medir que (i) asigne a un intervalo $[a,b]$ la "medida" $b-a$ ii) será invariante por traslación, de modo que si $F=E+c = \{e+c | e\in E\}$ entonces $\mu(F)=\mu(E)$ (iii) será contablemente aditivo: si $E = \cup_{i=1}^{\infty}E_i$ y el $E_i$ son disjuntos, entonces $\mu(E) = \sum\mu(E_i)$ ; y (iv) cada subconjunto de la línea tendrá una medida bien definida (posiblemente infinita). (Si no se acepta el axioma de elección, entonces hay modelos de los reales en los que puede conseguirlo). Así que se elimina la restricción (iv), y se construye una medida para la que algunos conjuntos serán "demasiado raros" para tener una medida. Entonces restringimos la atención a ciertos tipos de funciones (llamadas funciones medibles), que son aquellas para las que los conjuntos que obtenemos en el proceso descrito anteriormente son todos conjuntos medibles. Y entonces definimos la integral de Lebesgue para esas funciones, siguiendo la idea descrita anteriormente (pero no se define exactamente así, sino que la forma habitual es describir $f$ como límite de funciones para las que la integral es fácil, y luego calcular la integral de $f$ como límite de las integrales que son fáciles).
Para su función, $f(x)=x^2$ es bastante fácil: todos los valores se encuentran entre $0$ y $1$ por lo que digamos que dividimos el rango en subintervalos de longitud $1/n$ Así que $y_i = i/n$ , $i=0,\ldots,n$ . Entonces $$f^{-1}([y_i,y_{i+1}]) = f^{-1}([i/n, (i+1)/n]) = [\sqrt{i/n},\sqrt{(i+1)/n}],$$ por lo que el $n$ estimación, eligiendo $y_i^* = y_i = i/n$ es sólo $$\sum_{i=0}^n (i/n)\left(\sqrt{(i+1)/n} - \sqrt{i/n}\right).$$ Tome el límite como $n\to\infty$ y obtendrá que el límite es $\frac{1}{3}$ como era de esperar. (Me ahorraré los detalles; véase el final de esta respuesta para una forma de obtener la respuesta de forma similar a como se hace con la integral de Riemann).
Resulta que no todas las funciones son Lebesgue-integrables, al igual que no todas las funciones son Riemann-integrables. Pero toda función que sea Riemann-integrable también sea integrable en Lebesgue, y el valor de su integral de Lebesgue será el mismo que el de su integral de Riemann. Pero hay funciones que son no Riemann-integrable pero son Lebesgue-integrable (por ejemplo, la función característica de los racionales es Lebesgue-integrable, con integral $0$ sobre cualquier intervalo, pero no es integrable en Riemann). También tenemos un "Teorema fundamental del cálculo" para la integral de Lebesgue:
Teorema. Si $F$ es una función diferenciable, y la derivada $F'$ está acotado en el intervalo $[a,b]$ entonces $F'$ es integrable por Lebesgue en $[a,b]$ y $$\int_a^x F'\,d\mu = F(x) - F(a).$$
Aquí, la integral es la integral de Lebesgue.
En particular, para finalmente responder a la pregunta que hace sobre su ejemplo, ya que $F(x)=\frac{x^3}{3}$ es una función diferenciable cuya derivada está acotada en cualquier intervalo finito, en particular en $[0,1]$ entonces de este teorema se puede deducir que la integral sobre el intervalo $[0,1]$ de la derivada $F'(x)=x^2$ es igual a $F(1)-F(0)$ eso es, $$\int_0^1 x^2\,d\mu = \int_0^1 \left(\frac{x^3}{3}\right)'\,d\mu = \frac{1}{3} - \frac{0}{3} =\frac{1}{3}.$$
Recomiendo el libro Un jardín de integrales de Frank E. Burk (Dolciani Mathematical Expositions 31, MAA, 2007, ISBN 9-780883-853375); analiza y compara la integral de Cauchy, la integral de Riemann, la integral de Riemann-Stieltjes, la integral de Lebesgue, la integral de Lebesgue-Stieltjes y la integral de Henstock-Kurzweil; también analiza las integrales de Wiener y Feynman. He terminado de leerlo hace poco.
11 votos
¿Qué definición da "la expectativa de una variable aleatoria"? ¿Qué libro lo hace?
0 votos
¿Puede indicarme una fuente que lo explique mejor con algunos ejemplos?
0 votos
La variable aleatoria es la altura de la curva.
1 votos
Sospecho que está aprendiendo de un libro de finanzas matemáticas.
0 votos
@QiaochuYuan: Estoy luchando con las variables aleatorias, y me encontré con su declaración. Por lo tanto, sólo me pregunto, ¿puedo preguntar a qué te refieres con "la variable aleatoria es la altura de la curva"? Muchas gracias.