4 votos

Dudas sobre los axiomas de la probabilidad

Sea S un conjunto, y sea $2^S$ sea el conjunto de potencias de S. Según mis conocimientos actuales (que son muy limitados, sobre todo porque no he visto ninguna aproximación a la probabilidad basada en la teoría de las medidas), los axiomas de la probabilidad nos dicen que existe una función $p: 2^S \rightarrow [0,1]$ con determinadas propiedades.

Pero esto parece un poco insatisfactorio por dos razones:

  • ¿Por qué tenemos que hacer esa suposición? Para un conjunto dado $S$ si construimos explícitamente una función $p:2^S \rightarrow [0,1]$ y demostrar que tiene las propiedades deseadas, entonces no necesitábamos suponer la existencia de tal función; a la inversa, si no podemos encontrar tal función, ¡entonces parece que no podemos decir nada sobre probabilidades en primer lugar!

  • ¿Cómo sabemos que esa función tiene algo que ver con lo que "probabilidad" significa "en el mundo real"? Todo lo que hemos hecho es identificar números reales en $[0,1]$ con subconjuntos del conjunto $S$ .

4voto

John Fouhy Puntos 759

La función $p$ es la probabilidad. Los axiomas intentan captar la noción intuitiva de probabilidad.

Supongamos que tienes alguna probabilidad (frecuentista) $p$ que puede asignar a cualquier "evento" (subconjunto de $S$ ). Como estamos utilizando la interpretación frecuentista, la función está siempre entre $0$ y $1$ y es aditivo - si $A$ y $B$ son conjuntos disjuntos de sucesos, entonces la probabilidad de que ocurra cualquiera de ellos debe ser la suma de las probabilidades individuales. Cuando $S$ es infinito las cosas se complican un poco más.

Además, puede construir la función $p$ preguntándose cuál debería ser la probabilidad. Si su noción de la probabilidad es razonable, entonces la resultante $p$ cumplirá todos los axiomas.

Los axiomas son importantes para poder demostrar cosas como la ley de los grandes números (que justifica la interpretación frecuentista) o el teorema central del límite. Para demostrar un teorema general, necesitamos describir a qué objeto se aplica.

Resulta que los axiomas mencionados bastan para obtener algunos resultados interesantes -como la ley de los grandes números- y no bastan para obtener otros, como el teorema central del límite (se necesitan momentos finitos).

En otras palabras, se podría decir que los axiomas de la probabilidad recogen la noción para la que se aplica la ley de los grandes números.

1voto

Bryan Roth Puntos 3592

Conseguí una copia de una edición antigua de Ross's Primer curso de probabilidad . Por axiomas de la probabilidad entiende lo siguiente:

Sea $S$ sea un conjunto. Entonces un subconjunto $E \subset S$ se denomina suceso, y los axiomas son axiomas para una función $P$ que asigna a cada acontecimiento $E \subset S$ un número real $P(E)$ . Lo son:

(1) Para todos $E$ en $S$ , $0 \leq P(E)\leq 1$ . (Así, la probabilidad de un suceso se sitúa entre $0$ y $1$ .)

(2) $P(S) = 1$ .

(3) Para cualquier secuencia $\{E_n\}_{n=1}^{\infty}$ de sucesos que son disjuntos por pares -- para todo $i \neq j$ , $E_i \cap E_j = \varnothing$ tenemos

$P(\bigcup_{n=1}^{\infty} E_i) = \sum_{n=1}^{\infty} P(E_i)$ .

(Éste es el famoso axioma de la "aditividad contable").

Esto es literalmente lo que dice. Por supuesto, como varias personas aquí ya han señalado, esto es equivocado . Lo aborda en un párrafo al final de la sección:

"Observación técnica. Hemos supuesto que $P(E)$ se define para todos los eventos del espacio muestral. En realidad, cuando el espacio muestral es un conjunto incontablemente infinito $P(E)$ se define sólo para una clase de sucesos llamados medibles. Sin embargo, esta restricción no tiene por qué preocuparnos, ya que todos los sucesos de interés práctico son mensurables."

Bueno, como matemático puro esto es una especie de bofetada en la cara, pero no importa.

¿Quizás la confusión de la OP proviene de algo parecido a un "axioma"? Si estudias geometría en el instituto, parece que un axioma significa "algo que tendrás que asumir porque no podrás demostrarlo". Pero esto no es lo que significa el término en las matemáticas modernas. Un axioma es más bien propiedad que una estructura determinada puede o no satisfacer. A menudo queremos estudiar todas las estructuras que satisfacen alguna familia de axiomas -- por ejemplo, grupos, anillos, espacios topológicos -- y el mérito de los axiomas es que uno puede demostrar resultados que se mantienen para cualquier estructura que satisface los axiomas. Y, de hecho, en la siguiente sección el autor demuestra algunas propiedades sencillas que deben cumplirse en cualquier espacio de probabilidad, es decir, para cualquier conjunto $S$ y función $P$ a partir de subconjuntos de $S$ a $\mathbb{R}$ por ejemplo, que si $E_1 \subset E_2$ entonces $P(E_1)\leq P(E_2)$ .

Por último, si se me permite: No creo que ningún estudiante de probabilidad tenga que tomarse muy en serio esto del "frecuentismo". En mi opinión, suena a matemáticas aplicadas, pero en realidad es filosofía: es decir, es mucho más difícil desarrollar una teoría coherente y satisfactoria de la probabilidad. $P(E)$ como un cierto límite definido a través de una relación y la experimentación repetida de lo que es o bien desarrollar la teoría de la probabilidad como rama de las matemáticas puras o aplicarlo para resolver problemas reales. Por ejemplo, muchos jugadores profesionales de póquer y bridge pueden resolver, y de hecho resuelven, ciertos problemas de probabilidad no del todo triviales en tiempo real, y no lo hacen filosofando sobre la naturaleza de la frecuencia...

1voto

Para responder a tu primera pregunta, los "axiomas de probabilidad" nos ayudan a articular nuestra intuición y las propiedades que deseamos para una función de probabilidad.

Por ejemplo, si se lanza una moneda normal y se sabe que una cruz tiene una probabilidad de $\frac1{5}$ entonces la probabilidad de cabeza se fija en $\frac4{5}$ . En este caso sólo tienes un grado de libertad.

Del mismo modo, si lanza un dado normal con $6$ caras que muestran números de $1$ a $6$ y si sabes que $2$ se produce con probabilidad $\frac5{21}$ y $5$ se produce con probabilidad $\frac6{97}$ entonces esto fija la probabilidad de algunos de los demás acontecimientos. Por ejemplo, la probabilidad de no obtener ni $2$ ni $5$ se fija en $1 - \frac5{21} - \frac6{97}$ .

Los conjuntos sobre los que se fija la probabilidad especificando la probabilidad de algunos conjuntos es la motivación de la definición de álgebra / $\sigma$ -álgebra.

Además, tenga en cuenta que su definición de probabilidad no tiene por qué estar en todo el $2^S$ . De hecho, en muchos casos interesantes no puede definir una función, que coincide con nuestra definición intuitiva de probabilidad, sobre el conjunto $2^S$ (Por ejemplo, no se puede definir una función no negativa e invariante de traslación en $\mathbb{R}$ sea contablemente aditiva en todo el $2^{\mathbb{R}}$ ).

Basta con definir una función sobre $\sigma$ -de $S$ y no en todo el $2^S$ . ( $2^S$ es un $\sigma$ -álgebra). Una $\sigma$ -álgebra podría ser algo como $\{\emptyset,A,A^C,S\}$ . Esto nos permite hablar de probabilidad del suceso $A$ . Esto se denomina $\sigma$ -generada por el conjunto $A$ . Definición de la probabilidad en $A$ fija la probabilidad del resto de elementos del $\sigma$ -generada por $A$ . En términos más generales, si le interesan algunos acontecimientos diga $S = \{A_{\alpha}\}_{\alpha \in \Gamma}$ basta con restringir nuestra definición de probabilidad a la $\sigma$ -generada por $S$ denotado por $\sigma(S)$ .

En cuanto a la segunda pregunta: "¿Cómo sabemos que dicha función tiene algo que ver con lo que sea que signifique "probabilidad" "en el mundo real"? Todo lo que hemos hecho es identificar números reales en [0,1] con subconjuntos del conjunto S"

Todo lo que hemos hecho ahora es, como usted ha dicho, para cada conjunto hemos asignado un número entre $0$ y $1$ que satisfacen ciertos axiomas. Es depende de usted para identificarlo con la probabilidad en el "mundo real".

Por ejemplo $S = \{0,1\}$ y definir $\mathbb{P}(\{0\}) = \frac1{147}$ . Puede o no elegir esto para modelar el lanzamiento de una moneda. Si crees que la moneda es justa, no elegirás este modelo, ya que dice que la moneda está sesgada.

La teoría establece el marco y corresponde al modelador comprobar si este modelo se ajusta a la "realidad" o al problema que le interesa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X