Al primer punto de Xi'an: Cuando se habla de $\sigma$ -algebras, estás preguntando sobre conjuntos medibles, por lo que lamentablemente cualquier respuesta debe centrarse en la teoría de la medida. Sin embargo, trataré de llegar a eso suavemente.
Una teoría de la probabilidad que admita todos los subconjuntos de conjuntos incontables romperá las matemáticas
Considere este ejemplo. Supongamos que tenemos un cuadrado unitario en $\mathbb{R}^2$ y te interesa la probabilidad de seleccionar al azar un punto que sea miembro de un conjunto específico en el cuadrado unitario. En muchas circunstancias, esto puede responderse fácilmente basándose en una comparación de las áreas de los diferentes conjuntos. Por ejemplo, podemos dibujar algunos círculos, medir sus áreas, y luego tomar la probabilidad como la fracción del cuadrado que cae en el círculo. Es muy sencillo.
¿Pero qué pasa si el área del conjunto de interés no está bien definida?
Si el área no está bien definida, entonces podemos razonar a dos conclusiones diferentes pero completamente válidas (en cierto sentido) sobre lo que es el área. Así que podríamos tener $P(A)=1$ por un lado y $P(A)=0$ por otro lado, lo que implica $0=1$ . Esto rompe todas las matemáticas sin remedio. Ahora puedes demostrar $5<0$ y una serie de otras cosas absurdas. Está claro que esto no es demasiado útil.
$\boldsymbol{\sigma}$ -las álgebras son el parche que arregla las matemáticas
¿Qué es un $\sigma$ -¿Álgebra, precisamente? En realidad no es tan aterrador. Es sólo una definición de los conjuntos que pueden ser considerados como eventos. Los elementos que no están en $\mathscr{F}$ simplemente no tienen una medida de probabilidad definida. Básicamente, $\sigma$ -Las álgebras son el "parche" que nos permite evitar algunos comportamientos patológicos de las matemáticas, como los conjuntos no medibles.
Los tres requisitos de un $\sigma$ -campo pueden considerarse como consecuencias de lo que nos gustaría hacer con la probabilidad: A $\sigma$ -campo es un conjunto que tiene tres propiedades:
- Cierre bajo uniones contables.
- Cierre bajo intersecciones contables.
- Cierre bajo complementos.
Los componentes de uniones contables e intersecciones contables son consecuencias directas del problema de los conjuntos no medibles. El cierre bajo complementos es una consecuencia de los axiomas de Kolmogorov: si $P(A)=2/3$ , $P(A^c)$ debe ser $1/3$ . Pero sin (3), podría ocurrir que $P(A^c)$ es indefinido. Eso sería extraño. El cierre bajo complementos y los axiomas de Kolmogorov nos permiten decir cosas como $P(A\cup A^c)=P(A)+1-P(A)=1$ .
Por último, estamos considerando los acontecimientos en relación con $\Omega$ por lo que requerimos además que $\Omega\in\mathscr{F}$
Buenas noticias: $\boldsymbol{\sigma}$ -las álgebras sólo son estrictamente necesarias para los conjuntos incontables
Pero también hay buenas noticias. O, al menos, una forma de eludir el problema. Sólo necesitamos $\sigma$ -si trabajamos en un conjunto con cardinalidad incontable. Si nos limitamos a conjuntos contables, entonces podemos tomar $\mathscr{F}=2^\Omega$ el conjunto de energía de $\Omega$ y no tendremos ninguno de estos problemas porque para los contables $\Omega$ , $2^\Omega$ consiste sólo en conjuntos medibles. (Esto se menciona en el segundo comentario de Xi'an.) Verás que algunos libros de texto cometen un sutil juego de manos en este punto y sólo consideran conjuntos contables cuando hablan de espacios de probabilidad.
Además, en los problemas geométricos en $\mathbb{R}^n$ es perfectamente suficiente con considerar sólo $\sigma$ -de conjuntos para los que la $\mathcal{L}^n$ se define la medida. Para fundamentar esto un poco más firmemente, $\mathcal{L}^n$ para $n=1,2,3$ corresponde a las nociones habituales de longitud, área y volumen. Así que lo que estoy diciendo en el ejemplo anterior es que el conjunto tiene que tener un área bien definida para que se le asigne una probabilidad geométrica. Y la razón es la siguiente: si admitimos conjuntos no medibles, entonces podemos llegar a situaciones en las que podemos asignar probabilidad 1 a algún suceso basado en alguna prueba, y probabilidad 0 a el mismo evento evento basado en alguna otra prueba.
Pero no dejes que la conexión con los conjuntos incontables te confunda. Un error común que $\sigma$ -Las álgebras son conjuntos contables. De hecho, pueden ser contables o incontables. Consideremos esta ilustración: como antes, tenemos un cuadrado unitario. Definamos $$\mathscr{F}=\text{All subsets of the unit square with defined $ \mathcal{L}^2 $ measure}.$$ Puedes dibujar un cuadrado $B$ con la longitud del lado $s$ para todos $s \in (0,1)$ y con una esquina en $(0,0)$ . Debe quedar claro que este cuadrado es un subconjunto del cuadrado unitario. Además, todos estos cuadrados tienen área definida, por lo que estos cuadrados son elementos de $\mathscr{F}$ . Pero también debe quedar claro que hay un número incontable de plazas $B$ El número de tales cuadrados es incontable, y cada cuadrado tiene una medida de Lebesgue definida.
Así que, en la práctica, a menudo basta con hacer la observación de que sólo se consideran conjuntos medibles por Lebesgue para avanzar en el problema de interés.
Pero espera, ¿qué es un conjunto no medible?
Me temo que yo mismo sólo puedo arrojar un poco de luz sobre esto. Pero el Paradoja de Banach-Tarski (a veces la paradoja del "sol y el guisante") puede ayudarnos un poco:
Dada una bola sólida en un espacio tridimensional, existe una descomposición de la bola en un número finito de subconjuntos disjuntos, que pueden volverse a juntar de forma diferente para obtener dos copias idénticas de la bola original. De hecho, el proceso de reensamblaje sólo implica mover las piezas y girarlas, sin cambiar su forma. Sin embargo, las propias piezas no son "sólidos" en el sentido habitual, sino infinitas dispersiones de puntos. La reconstrucción puede funcionar con tan sólo cinco piezas.
Una forma más fuerte del teorema implica que, dados dos objetos sólidos "razonables" (como una bola pequeña y otra enorme), cualquiera de ellos puede volver a convertirse en el otro. Esto se suele expresar de manera informal como "un guisante se puede cortar y volver a montar en el Sol" y se llama la "paradoja del guisante y el Sol". 1
Así que si estás trabajando con probabilidades en $\mathbb{R}^3$ y se utiliza la medida de la probabilidad geométrica (el cociente de volúmenes), se quiere calcular la probabilidad de algún suceso. Pero te costará definir esa probabilidad con precisión, ¡porque puedes reorganizar los conjuntos de tu espacio para cambiar los volúmenes! Si la probabilidad depende del volumen, y puedes cambiar el volumen del conjunto para que sea del tamaño del sol o del tamaño de un guisante, entonces la probabilidad también cambiará. Por lo tanto, ningún acontecimiento tendrá una única probabilidad atribuida. Además, se puede reordenar $S\in\Omega$ tal que el volumen de $S$ tiene $V(S)>V(\Omega)$ lo que implica que la medida de probabilidad geométrica reporta una probabilidad $P(S)>1$ en flagrante violación de los axiomas de Kolmogorov, que exigen que la probabilidad tenga medida 1.
Para resolver esta paradoja, se puede hacer una de estas cuatro concesiones:
- El volumen de un conjunto puede cambiar cuando se gira.
- El volumen de la unión de dos conjuntos disjuntos puede ser diferente de la suma de sus volúmenes.
- Es posible que haya que modificar los axiomas de la teoría de conjuntos de Zermelo-Fraenkel con el axioma de elección (ZFC).
- Algunos conjuntos podrían ser etiquetados como "no medibles", y habría que comprobar si un conjunto es "medible" antes de hablar de su volumen.
La opción (1) no ayuda a definir las probabilidades, así que queda descartada. La opción (2) viola el segundo axioma de Kolmogorov, así que queda descartada. La opción (3) parece una idea terrible porque ZFC soluciona muchos más problemas de los que crea. Pero la opción (4) parece atractiva: si desarrollamos una teoría de lo que es y no es medible, ¡tendremos probabilidades bien definidas en este problema! Esto nos lleva de nuevo a la teoría de la medida, y a nuestro amigo el $\sigma$ -Álgebra.
9 votos
Parece contraproducente pedir respuestas sobre $\sigma$ -¡Campos que no mencionan la teoría de la medida!
8 votos
Lo hice, aunque... No estoy seguro de entender su comentario.
8 votos
Seguramente la necesidad de los campos sigma no es sólo una cuestión de opinión... Creo que esto se puede considerar en el tema aquí (en mi opinión).
9 votos
Si su necesidad de la teoría de la probabilidad se limita a "cara" y "cruz", entonces claramente no hay necesidad de $\sigma$ -¡Campos!
5 votos
Precisamente el sentido de mi pregunta.
44 votos
Creo que esta es una buena pregunta. A menudo se ven en los libros de texto referencias completamente superfluas a los triples de probabilidad $(\Omega, \mathcal{F}, P)$ que el autor pasa a ignorar por completo a partir de entonces.
1 votos
He editado ligeramente el título, @Antoni, siéntete libre de retroceder si lo prefieres.
2 votos
¡@dsaxton, en toneladas de trabajos académicos, también!
0 votos
Re: edición -- La cuestión está directamente relacionada con el cálculo: la anchura de un intervalo infinitesimal tiene medida 0, pero el área bajo la curva sigue siendo integrable. Pero como estamos hablando de la mensurabilidad de los intervalos, e incluso del área bajo las curvas, volvemos al ámbito de la teoría de la medida.
0 votos
¿Realmente no hay nada más intuitivo que la paradoja del BT como ejemplo? Si crees que es así, simplemente "acepto" tu respuesta y dejo de intentar simplificar más el problema... Y antes de cerrar el capítulo, ¿conoces algún buen recurso para entender la teoría de la medida sin ser matemático?
0 votos
Tengo una referencia en mis notas a un volumen llamado Probabilidad y medida Pero no lo he leído, así que no puedo hablar del nivel de su contenido. Re: La paradoja del BT, creo que también podríamos llegar a ella con los fractales, que tienen muchas propiedades enojosas, pero no estoy seguro. Me temo que es un área de la estadística donde el material es más difícil precisamente porque los resultados son profundamente contraintuitivos.
3 votos
Otra cosa que siempre me pareció desconcertante fue la aparición de $\sigma$ -campos en la teoría de la martingala. ¿Hay alguna razón para decir que estamos condicionando $\mathcal{F}_n$ en lugar del pasado hasta el momento $n$ ?
3 votos
¡@dsaxton esta sería una gran pregunta para hacer en su propio hilo!
1 votos
@AntoniParellada Probabilidad y medida de Billingsley implica matemáticas avanzadas y puede no ser adecuado para personas sin una sólida formación matemática. Para una introducción más suave lea 'The elements of integration and lebesgue measure' de Bartle.