199 votos

¿Por qué necesitamos las álgebras sigma para definir los espacios de probabilidad?

Tenemos un experimento aleatorio con diferentes resultados formando el espacio de muestra $\Omega,$ en la que miramos con interés ciertos patrones, llamados eventos $\mathscr{F}.$ Álgebras sigma (o campos sigma) se componen de sucesos a los que se aplica una medida de probabilidad $\mathbb{P}$ pueden ser asignados. Se cumplen ciertas propiedades, como la inclusión del conjunto nulo $\varnothing$ y todo el espacio muestral, y un álgebra que describe las uniones e intersecciones con diagramas de Venn.

La probabilidad se define como una función entre el $\sigma$ -y el intervalo $[0,1]$ . En total, el triple $(\Omega, \mathscr{F}, \mathbb{P})$ forma un espacio de probabilidad .

¿Podría alguien explicar en lenguaje sencillo por qué el edificio de la probabilidad se derrumbaría si no tuviéramos un $\sigma$ -¿Álgebra? Sólo están metidos en el medio con esa "F" imposiblemente caligráfica. Confío en que sean necesarias; veo que un acontecimiento es diferente de un resultado, pero ¿qué se estropearía sin un $\sigma$ -¿las álgebras?

La pregunta es: ¿En qué tipo de problemas de probabilidad se define un espacio de probabilidad que incluya un $\sigma$ -¿el álgebra se convierte en una necesidad?


Este documento en línea en el sitio web de la Universidad de Dartmouth ofrece una explicación accesible en inglés. La idea es un puntero que gira en sentido contrario a las agujas del reloj en un círculo de unidad perímetro:

enter image description here

Comenzamos construyendo un spinner, que consiste en un círculo de circunferencia unitaria y un puntero como se muestra en la figura. Elegimos un punto en el círculo y lo etiquetamos como $0$ y luego etiquetar cada uno de los otros puntos del con la distancia, digamos $x$ , de $0$ hasta ese punto, medido en sentido contrario a las agujas del reloj. El experimento consiste en hacer girar el puntero y registrar la etiqueta del punto en la punta del puntero. Dejamos que la variable aleatoria variable aleatoria $X$ denotan el valor de este resultado. El espacio muestral es claramente el intervalo $[0,1)$ . Nos gustaría construir un modelo de probabilidad en el que cada resultado tenga la misma probabilidad de ocurrir. Si procedemos como lo hicimos [...] para los experimentos con un número finito de resultados posibles, entonces debemos asignar la probabilidad $0$ a cada resultado, ya que, de lo contrario, la suma de las probabilidades, sobre todos los resultados posibles, no sería igual a 1. (De hecho, sumar un número incontable de números reales es un asunto complicado; en particular, para que dicha suma tenga algún significado, a lo sumo un número contable de sumandos puede ser diferente de $0$ .) Sin embargo, si todas las probabilidades asignadas son $0$ , entonces la suma es $0$ no $1$ como debe ser.

Así que si asignamos a cada punto una probabilidad cualquiera, y dado que hay un número (incontablemente) infinito de puntos, su suma sumaría $> 1$ .

9 votos

Parece contraproducente pedir respuestas sobre $\sigma$ -¡Campos que no mencionan la teoría de la medida!

8 votos

Lo hice, aunque... No estoy seguro de entender su comentario.

8 votos

Seguramente la necesidad de los campos sigma no es sólo una cuestión de opinión... Creo que esto se puede considerar en el tema aquí (en mi opinión).

204voto

user777 Puntos 10934

Al primer punto de Xi'an: Cuando se habla de $\sigma$ -algebras, estás preguntando sobre conjuntos medibles, por lo que lamentablemente cualquier respuesta debe centrarse en la teoría de la medida. Sin embargo, trataré de llegar a eso suavemente.

Una teoría de la probabilidad que admita todos los subconjuntos de conjuntos incontables romperá las matemáticas

Considere este ejemplo. Supongamos que tenemos un cuadrado unitario en $\mathbb{R}^2$ y te interesa la probabilidad de seleccionar al azar un punto que sea miembro de un conjunto específico en el cuadrado unitario. En muchas circunstancias, esto puede responderse fácilmente basándose en una comparación de las áreas de los diferentes conjuntos. Por ejemplo, podemos dibujar algunos círculos, medir sus áreas, y luego tomar la probabilidad como la fracción del cuadrado que cae en el círculo. Es muy sencillo.

¿Pero qué pasa si el área del conjunto de interés no está bien definida?

Si el área no está bien definida, entonces podemos razonar a dos conclusiones diferentes pero completamente válidas (en cierto sentido) sobre lo que es el área. Así que podríamos tener $P(A)=1$ por un lado y $P(A)=0$ por otro lado, lo que implica $0=1$ . Esto rompe todas las matemáticas sin remedio. Ahora puedes demostrar $5<0$ y una serie de otras cosas absurdas. Está claro que esto no es demasiado útil.

$\boldsymbol{\sigma}$ -las álgebras son el parche que arregla las matemáticas

¿Qué es un $\sigma$ -¿Álgebra, precisamente? En realidad no es tan aterrador. Es sólo una definición de los conjuntos que pueden ser considerados como eventos. Los elementos que no están en $\mathscr{F}$ simplemente no tienen una medida de probabilidad definida. Básicamente, $\sigma$ -Las álgebras son el "parche" que nos permite evitar algunos comportamientos patológicos de las matemáticas, como los conjuntos no medibles.

Los tres requisitos de un $\sigma$ -campo pueden considerarse como consecuencias de lo que nos gustaría hacer con la probabilidad: A $\sigma$ -campo es un conjunto que tiene tres propiedades:

  1. Cierre bajo uniones contables.
  2. Cierre bajo intersecciones contables.
  3. Cierre bajo complementos.

Los componentes de uniones contables e intersecciones contables son consecuencias directas del problema de los conjuntos no medibles. El cierre bajo complementos es una consecuencia de los axiomas de Kolmogorov: si $P(A)=2/3$ , $P(A^c)$ debe ser $1/3$ . Pero sin (3), podría ocurrir que $P(A^c)$ es indefinido. Eso sería extraño. El cierre bajo complementos y los axiomas de Kolmogorov nos permiten decir cosas como $P(A\cup A^c)=P(A)+1-P(A)=1$ .

Por último, estamos considerando los acontecimientos en relación con $\Omega$ por lo que requerimos además que $\Omega\in\mathscr{F}$

Buenas noticias: $\boldsymbol{\sigma}$ -las álgebras sólo son estrictamente necesarias para los conjuntos incontables

Pero también hay buenas noticias. O, al menos, una forma de eludir el problema. Sólo necesitamos $\sigma$ -si trabajamos en un conjunto con cardinalidad incontable. Si nos limitamos a conjuntos contables, entonces podemos tomar $\mathscr{F}=2^\Omega$ el conjunto de energía de $\Omega$ y no tendremos ninguno de estos problemas porque para los contables $\Omega$ , $2^\Omega$ consiste sólo en conjuntos medibles. (Esto se menciona en el segundo comentario de Xi'an.) Verás que algunos libros de texto cometen un sutil juego de manos en este punto y sólo consideran conjuntos contables cuando hablan de espacios de probabilidad.

Además, en los problemas geométricos en $\mathbb{R}^n$ es perfectamente suficiente con considerar sólo $\sigma$ -de conjuntos para los que la $\mathcal{L}^n$ se define la medida. Para fundamentar esto un poco más firmemente, $\mathcal{L}^n$ para $n=1,2,3$ corresponde a las nociones habituales de longitud, área y volumen. Así que lo que estoy diciendo en el ejemplo anterior es que el conjunto tiene que tener un área bien definida para que se le asigne una probabilidad geométrica. Y la razón es la siguiente: si admitimos conjuntos no medibles, entonces podemos llegar a situaciones en las que podemos asignar probabilidad 1 a algún suceso basado en alguna prueba, y probabilidad 0 a el mismo evento evento basado en alguna otra prueba.

Pero no dejes que la conexión con los conjuntos incontables te confunda. Un error común que $\sigma$ -Las álgebras son conjuntos contables. De hecho, pueden ser contables o incontables. Consideremos esta ilustración: como antes, tenemos un cuadrado unitario. Definamos $$\mathscr{F}=\text{All subsets of the unit square with defined $ \mathcal{L}^2 $ measure}.$$ Puedes dibujar un cuadrado $B$ con la longitud del lado $s$ para todos $s \in (0,1)$ y con una esquina en $(0,0)$ . Debe quedar claro que este cuadrado es un subconjunto del cuadrado unitario. Además, todos estos cuadrados tienen área definida, por lo que estos cuadrados son elementos de $\mathscr{F}$ . Pero también debe quedar claro que hay un número incontable de plazas $B$ El número de tales cuadrados es incontable, y cada cuadrado tiene una medida de Lebesgue definida.

Así que, en la práctica, a menudo basta con hacer la observación de que sólo se consideran conjuntos medibles por Lebesgue para avanzar en el problema de interés.

Pero espera, ¿qué es un conjunto no medible?

Me temo que yo mismo sólo puedo arrojar un poco de luz sobre esto. Pero el Paradoja de Banach-Tarski (a veces la paradoja del "sol y el guisante") puede ayudarnos un poco:

Dada una bola sólida en un espacio tridimensional, existe una descomposición de la bola en un número finito de subconjuntos disjuntos, que pueden volverse a juntar de forma diferente para obtener dos copias idénticas de la bola original. De hecho, el proceso de reensamblaje sólo implica mover las piezas y girarlas, sin cambiar su forma. Sin embargo, las propias piezas no son "sólidos" en el sentido habitual, sino infinitas dispersiones de puntos. La reconstrucción puede funcionar con tan sólo cinco piezas.

Una forma más fuerte del teorema implica que, dados dos objetos sólidos "razonables" (como una bola pequeña y otra enorme), cualquiera de ellos puede volver a convertirse en el otro. Esto se suele expresar de manera informal como "un guisante se puede cortar y volver a montar en el Sol" y se llama la "paradoja del guisante y el Sol". 1

Así que si estás trabajando con probabilidades en $\mathbb{R}^3$ y se utiliza la medida de la probabilidad geométrica (el cociente de volúmenes), se quiere calcular la probabilidad de algún suceso. Pero te costará definir esa probabilidad con precisión, ¡porque puedes reorganizar los conjuntos de tu espacio para cambiar los volúmenes! Si la probabilidad depende del volumen, y puedes cambiar el volumen del conjunto para que sea del tamaño del sol o del tamaño de un guisante, entonces la probabilidad también cambiará. Por lo tanto, ningún acontecimiento tendrá una única probabilidad atribuida. Además, se puede reordenar $S\in\Omega$ tal que el volumen de $S$ tiene $V(S)>V(\Omega)$ lo que implica que la medida de probabilidad geométrica reporta una probabilidad $P(S)>1$ en flagrante violación de los axiomas de Kolmogorov, que exigen que la probabilidad tenga medida 1.

Para resolver esta paradoja, se puede hacer una de estas cuatro concesiones:

  1. El volumen de un conjunto puede cambiar cuando se gira.
  2. El volumen de la unión de dos conjuntos disjuntos puede ser diferente de la suma de sus volúmenes.
  3. Es posible que haya que modificar los axiomas de la teoría de conjuntos de Zermelo-Fraenkel con el axioma de elección (ZFC).
  4. Algunos conjuntos podrían ser etiquetados como "no medibles", y habría que comprobar si un conjunto es "medible" antes de hablar de su volumen.

La opción (1) no ayuda a definir las probabilidades, así que queda descartada. La opción (2) viola el segundo axioma de Kolmogorov, así que queda descartada. La opción (3) parece una idea terrible porque ZFC soluciona muchos más problemas de los que crea. Pero la opción (4) parece atractiva: si desarrollamos una teoría de lo que es y no es medible, ¡tendremos probabilidades bien definidas en este problema! Esto nos lleva de nuevo a la teoría de la medida, y a nuestro amigo el $\sigma$ -Álgebra.

8 votos

Gracias por su respuesta. $\mathcal{L}$ ¿se refiere a los medibles de Lebesque? Voy a +1 su respuesta en la fe, pero realmente apreciaría si usted podría bajar el nivel de las matemáticas varias muescas ... :-)

0 votos

¿No es mucho más común llamarlo $\sigma$ -y no una $\sigma$ -¿Campo? Nunca había oído el término "campo sigma" y el artículo de la Wiki se llama Álgebra sigma aunque menciona que también se llama "campo sigma". CC a @Antoni que escribió su pregunta utilizando la terminología "campo sigma" (incluso sin el guión).

0 votos

Gracias, @amoeba. No estaba seguro, pero editaré en consecuencia.

28voto

kjetil b halvorsen Puntos 7012

La idea subyacente (en términos muy prácticos) es sencilla. Supongamos que usted es un estadístico que trabaja con una encuesta. Supongamos que la encuesta tiene algunas preguntas sobre la edad, pero sólo pide al encuestado que identifique su edad en algunos intervalos determinados, como $[0,18), [18, 25), [25,34), \dots $ . Olvidemos las demás preguntas. Este cuestionario define un "espacio para eventos", su $(\Omega,F)$ . El álgebra sigma $F$ codifica toda la información que se puede obtener del cuestionario, por lo que, para la pregunta sobre la edad (y por ahora ignoramos todas las demás preguntas), contendrá el intervalo $[18,25)$ pero no otros intervalos como $[20,30)$ ya que a partir de la información obtenida por el cuestionario no podemos responder a preguntas como: ¿la edad de los encuestados pertenece a $[20,30)$ ¿o no? De forma más general, un conjunto es un evento (pertenece a $F$ ) si y sólo si podemos decidir si un punto de la muestra pertenece a ese conjunto o no.

Ahora, definamos variables aleatorias con valores en el segundo espacio de eventos, $(\Omega', F')$ . Como ejemplo, tomemos que es la recta real con el álgebra sigma habitual (Borel). Entonces, una función (no interesante) que no es una variable aleatoria es $f: $ "La edad de los encuestados es un número primo", codificando esto como 1 si la edad es prima, 0 en caso contrario. No, $f^{-1}(1)$ no pertenecen a $F$ Así que $f$ no es una variable aleatoria. La razón es sencilla, ¡no podemos decidir a partir de la información del cuestionario si la edad del encuestado es primordial o no! Ahora puedes hacer tú mismo ejemplos más interesantes.

¿Por qué necesitamos $F$ ¿es un álgebra sigma? Supongamos que queremos hacer dos preguntas a los datos, "el encuestado número 3 tiene 18 años o más", "el encuestado 3 es una mujer". Dejemos que las preguntas definan dos eventos (conjuntos en $F$ ) $A$ y $B$ los conjuntos de puntos de muestra que dan una respuesta afirmativa a esa pregunta. Ahora hagamos la conjunción de las dos preguntas "¿es el encuestado 3 una mujer de 18 años o más? Ahora esa pregunta está representada por el conjunto intersección $A \cap B$ . De forma similar, las disyunciones se representan mediante la unión de conjuntos $A \cup B$ . Ahora bien, el hecho de exigir que las intersecciones y las uniones sean cerradas nos permite plantear conjunciones o disyunciones contables. Y la negación de una pregunta está representada por el conjunto complementario. Esto nos da una álgebra sigma.

Vi este tipo de introducción por primera vez en el muy buen libro de Peter Whittle "Probability via expectation" (Springer).

EDITAR

Tratando de responder a la pregunta de whubers en un comentario: "Sin embargo, me sorprendió un poco al final, cuando me encontré con esta afirmación: "exigir la cerrazón para las intersecciones y uniones contables nos permite pedir conjunciones o disyunciones contables". Esto parece llegar al corazón de la cuestión: ¿por qué querría alguien construir un evento tan infinitamente complicado? " Bueno, ¿por qué? Limitémonos ahora a la probabilidad discreta, digamos, por comodidad, el lanzamiento de una moneda. Al lanzar la moneda un número finito de veces, todos los sucesos que podemos describir utilizando la moneda pueden expresarse a través de sucesos del tipo "cara en el lanzamiento $i$ ", "colas en el lanzamiento $i$ y un número finito de "y" o "o". Por lo tanto, en esta situación, no necesitamos $\sigma$ -algebras, álgebras de conjuntos es suficiente. Entonces, ¿hay alguna situación, en este contexto, en la que $\sigma$ -¿se producen álgebras? En la práctica, aunque sólo podamos lanzar los dados un número finito de veces, desarrollamos aproximaciones a las probabilidades mediante teoremas de límite cuando $n$ el número de lanzamientos, crece sin límite. Así que echa un vistazo a la demostración del teorema del límite central para este caso, el teorema de Laplace-de Moivre. Podemos demostrar mediante aproximaciones utilizando sólo álgebras, no $\sigma$ -de la ley de los grandes números. La ley débil de los grandes números puede demostrarse a través de la desigualdad de Chebyshev, y para ello sólo necesitamos calcular la varianza para un $n$ casos. Pero, para el ley de los grandes números El evento que probamos que tiene probabilidad uno sólo puede ser expresado a través de un número contablemente infinito de "y" y "o", así que para la ley fuerte de los grandes números necesitamos $\sigma$ -algebras.

Pero, ¿realmente necesitamos la ley de los grandes números? Según una respuesta aquí tal vez no.

En cierto modo, esto señala una diferencia conceptual muy grande entre la ley fuerte y la ley débil de los grandes números: La ley fuerte no tiene un significado empírico directo, ya que se refiere a la convergencia real, que nunca puede verificarse empíricamente. En cambio, la ley débil se refiere a que la calidad de la aproximación aumenta con $n$ con límites numéricos para el $n$ por lo que es más significativo empíricamente.

Así, todo uso práctico de la probabilidad discreta podría prescindir de $\sigma$ -algebras. Para el caso continuo, no estoy tan seguro.

1 votos

Muy buen ejemplo. En el primer párrafo, podría haber escrito: "... no podemos responder a preguntas como: ¿la edad de los encuestados pertenece al intervalo $[20,30)$ ¿o no?"

4 votos

No creo que esta respuesta demuestre por qué $\sigma$ -Campos son necesarios. La conveniencia de poder responder $P(A)\in[20,30)$ no es un mandato de las matemáticas. De forma un tanto pícara, se podría decir que las matemáticas no se preocupan por lo que les conviene a los estadísticos. En realidad, sabemos que $P(A)\in[20,30)\le P(A)\in[18,34)$ que es bien definida, por lo que ni siquiera está claro que este ejemplo ilustre lo que tú quieres.

0 votos

Bueno, no creo que su crítica sea válida. Mientras que las matemáticas no se preocupan por lo que necesitan los estadísticos, los estadísticos se preocupan por lo que las matemáticas pueden ofrecerles, y eso es lo que he intentado explicar. Además, tu desigualdad es irrelevante, porque, con los datos que tenemos, no podemos responder si la edad está en $[20, 30)$ por lo que no se puede estimar la probabilidad de ese evento a partir de estos datos.

6voto

Yatharth Agarwal Puntos 181

¿Por qué los probabilistas necesitan $\boldsymbol{\sigma}$ -¿Álgebra?

Los axiomas de $\sigma$ -Las álgebras están motivadas naturalmente por la probabilidad. Quieres ser capaz de medir todas las regiones del diagrama de Venn, por ejemplo, $A \cup B$ , $(A\cup B)\cap C$ . Citando a esta respuesta memorable :

El primer axioma es que $\oslash,X\in \sigma$ . Bueno, usted sabe SIEMPRE la probabilidad de que no ocurra nada ( $0$ ) o que ocurra algo ( $1$ ).

El segundo axioma es cerrado bajo complementos. Permítanme ofrecer un ejemplo estúpido. De nuevo, consideremos el lanzamiento de una moneda, con $X=\{H,T\}$ . Imagina que te digo que el $\sigma$ El álgebra para este giro es $\{\oslash,X,\{H\}\}$ . Es decir, conozco la probabilidad de que no ocurra NADA, de que ocurra ALGO y de que salga cara, pero NO conozco la probabilidad de que salga cruz. Me llamarías, con razón, imbécil. Porque si conoces la probabilidad de que salga cara, ¡automáticamente conoces la probabilidad de que salga cruz! ¡Si conoces la probabilidad de que algo ocurra, conoces la probabilidad de que NO ocurra (el complemento)!

El último axioma es cerrado bajo uniones contables. Permítanme darles otro ejemplo estúpido. Consideremos la tirada de un dado, o $X=\{1,2,3,4,5,6\}$ . ¿Y si te dijera la $\sigma$ El álgebra para esto es $\{\oslash,X,\{1\},\{2\}\}$ . Es decir, conozco la probabilidad de sacar un $1$ o rodar un $2$ pero no sé la probabilidad de sacar un $1$ o un $2$ . De nuevo, me llamarías con razón idiota (espero que la razón esté clara). Lo que ocurre cuando los conjuntos no son disjuntos, y lo que ocurre con las uniones incontables es un poco más complicado, pero espero que puedas intentar pensar en algunos ejemplos.

¿Por qué se necesita que sea contable en lugar de simplemente finito? $\boldsymbol{\sigma}$ -¿Aditividad, sin embargo?

Bueno, no es un caso totalmente limpio, pero hay algunos sólidos razones por las que .

¿Por qué los probabilistas necesitan medidas?

En este punto, ya tienes todos los axiomas para una medida. En $\sigma$ -aditividad, no negatividad, conjunto vacío nulo, y el dominio de $\sigma$ -Álgebra. También podría requerir $P$ para ser una medida. La teoría de la medida es ya está justificado .

La gente trae el conjunto de Vitali y Banach-Tarski para explicar por qué se necesita la teoría de la medida, pero creo que eso es engañosa . El conjunto de Vitali sólo desaparece para las medidas (no triviales) que son invariantes de la traslación, lo que no requieren los espacios de probabilidad. Y Banach-Tarski requiere invariancia de rotación. Los analistas se preocupan por ellos, pero los probabilistas no .

El razón de ser de la teoría de la medida en la teoría de la probabilidad es unificar el tratamiento de los VR discretos y continuos, y además, permitir los VR que son mixtos y los VR que simplemente no son ninguno de los dos.

3 votos

Creo que esta respuesta podría ser un gran aporte a este hilo si la reelaboras un poco. Tal y como está, es difícil de seguir porque gran parte de ella depende de enlaces a otros hilos de comentarios. Creo que si usted lo presentó como una explicación de abajo hacia arriba de cómo las medidas, finito $\sigma$ -aditividad y $\sigma$ -álgebra encajan como características necesarias de los espacios de probabilidad, sería mucho más fuerte. Estás muy cerca, porque ya has dividido la respuesta en diferentes segmentos, pero creo que los segmentos necesitan más justificación y razonamiento para estar completamente apoyados.

2 votos

El enlace al "sólido razones por las que "está roto :( ¿Alguien tiene un enlace que funcione, o un resumen del mismo?

5voto

Marc Jacobsohn Puntos 51

Siempre he entendido toda la historia así:

Empezamos con un espacio, como la línea real $\mathbb{R}$ . Nos gustaría aplicar nuestra medida a subconjuntos de este espacio, como por ejemplo aplicando la medida de Lebesgue, que mide la longitud. Un ejemplo sería medir la longitud del subconjunto $[0, 0.5] \cup [0.75, 1]$ . Para este ejemplo la respuesta es simplemente $0.5 + 0.25 = 0.75$ que podemos obtener con bastante facilidad. Empezamos a preguntarnos si podemos aplicar la medida de Lebesgue a todo subconjuntos de la línea real.

Por desgracia, no funciona. Existen estos conjuntos patológicos que simplemente rompen las matemáticas. Si se aplica la medida de Lebesgue a estos conjuntos, se obtienen resultados incoherentes. Un ejemplo de uno de estos conjuntos patológicos, también conocidos como conjuntos no medibles porque literalmente no se pueden medir, son los Conjuntos de Vitali.

Para evitar estos conjuntos locos, definimos la medida para que sólo funcione para un grupo más pequeño de subconjuntos, llamados conjuntos medibles. Estos son los conjuntos que se comportan de forma consistente cuando les aplicamos medidas. Para poder realizar operaciones con estos conjuntos, como combinarlos con uniones o tomar sus complementos, requerimos que estos conjuntos medibles formen una sigma-álgebra entre ellos. Al formar una sigma-álgebra, hemos formado una especie de refugio seguro para que nuestras medidas operen dentro de ella, al tiempo que nos permite hacer manipulaciones razonables para conseguir lo que queremos, como tomar uniones y complementos. Por eso necesitamos una álgebra sigma, para poder trazar una región dentro de la cual funcione la medida, evitando al mismo tiempo conjuntos no medibles. Obsérvese que si no fuera por estos subconjuntos patológicos, puedo definir fácilmente la medida para que opere dentro del conjunto de potencias del espacio topológico. Sin embargo, el conjunto de potencias contiene todo tipo de conjuntos no medibles, y por eso tenemos que elegir los medibles y hacer que formen una sigma-álgebra entre ellos.

Como puede ver, dado que las álgebras sigma se utilizan para evitar los conjuntos no medibles, los conjuntos que tienen un tamaño finito no necesitan realmente un álgebra sigma. Digamos que se trata de un espacio muestral $\Omega = \{1, 2, 3\}$ (esto podría ser todo el resultado posible de un número aleatorio generado por un ordenador). Se puede ver que es prácticamente imposible obtener conjuntos no medibles con un espacio muestral así. La medida (en este caso una medida de probabilidad) está bien definida para cualquier subconjunto de $\Omega$ que se te ocurra. Pero nosotros hacer necesitamos definir álgebras sigma para espacios muestrales más grandes, como la línea real, de modo que podamos evitar subconjuntos patológicos que descompongan nuestras medidas. Para lograr la coherencia en el marco teórico de la probabilidad, exigimos que los espacios muestrales finitos también forman álgebras sigma, en las que sólo se define la medida de probabilidad. Las álgebras sigma en espacios muestrales finitos son un tecnicismo, mientras que las álgebras sigma en espacios muestrales mayores, como la línea real, son un necesidad .

Una sigma-álgebra común que utilizamos para la línea real es la sigma-álgebra de Borel. Está formada por todos los conjuntos abiertos posibles, y luego se toman los complementos y las uniones hasta que se cumplen las tres condiciones de una sigma-álgebra. Digamos que si se construye la sigma-álgebra de Borel para $\mathbb{R}[0, 1]$ se hace enumerando todos los conjuntos abiertos posibles, como por ejemplo $(0.5, 0.7), (0.03, 0.05), (0.2, 0.7), ...$ y así sucesivamente, y como puedes imaginar hay infinitas posibilidades que puedes enumerar, y luego tomas los complementos y las uniones hasta que se genera una álgebra sigma. Como puedes imaginar esta álgebra sigma es una BESTIA. Es inimaginablemente enorme. Pero lo más bonito es que excluye todos los conjuntos patológicos locos que rompieron las matemáticas. Esos conjuntos locos son no en el álgebra sigma de Borel. Además, este conjunto es lo suficientemente amplio como para incluir casi todos los subconjuntos que necesitamos. Es difícil pensar en un subconjunto que no esté contenido en el álgebra sigma de Borel.

Y esta es la historia de por qué necesitamos álgebras sigma y las álgebras sigma de Borel son una forma común de implementar esta idea.

2 votos

'+1' muy legible. Sin embargo, pareces contradecir la respuesta de @Yatharth Agarwal que dice "La gente trae el conjunto de Vitali y Banach-Tarski para explicar por qué necesitas la teoría de la medida, pero creo que eso es engañoso. El conjunto de Vitali sólo desaparece para las medidas (no triviales) que son invariantes de la traslación, lo que no requieren los espacios de probabilidad. Y Banach-Tarski requiere invariancia de rotación. Los analistas se preocupan por ello, pero los probabilistas no lo hacen". ¿Tal vez tenga alguna idea al respecto?

2 votos

+1 (¡especialmente por la metáfora del "refugio seguro"!). @Stop Dado que la respuesta a la que haces referencia tiene poco contenido real -sólo expresa algunas opiniones- no merece mucha consideración ni debate, en mi opinión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X