18 votos

Los axiomas de probabilidad de Kolmogorov

Por qué Axiomas de Kolmogorov se consideran un gran avance en la teoría de la probabilidad? Son sólo 3 simples afirmaciones con las que todo el mundo puede estar de acuerdo.

Cuando se crea un sistema de axiomas como éste es necesario que la lista de los axiomas esté completa. Supongamos que nos olvidamos del tercer axioma de Kolmogorov. Entonces tendríamos 2 axiomas con los que todo el mundo podría estar de acuerdo al pensar en la probabilidad. ¿Significa esto que los 2 axiomas son suficientes para afirmar que éste es un buen sistema axiomático de probabilidad? Sabemos que no lo es, porque queda el tercer axioma fuera. Pero tal vez estos 3 axiomas no son suficientes también de manera similar.

Fíjate en el quinto axioma de Euclides (postulado de las paralelas). Si omitimos el quinto postulado, obtenemos una geometría hiperbólica, que ciertamente no es lo que queríamos tener. Aquí se plantea una cuestión similar: ¿son suficientes esos axiomas? ¿Estamos seguros de que no obtendremos resultados no deseados sólo siguiendo estos 3 axiomas?

O tal vez la afirmación de que un determinado conjunto de axiomas concuerda con nuestra intuición de, digamos, la probabilidad, debe ser tratada en sí misma como un axioma. No podemos demostrarlo. Los axiomas de Kolmogorov han sobrevivido tantos años sin mayores quejas, que se cree que coinciden con nuestra intuición sobre lo que es la probabilidad con exactitud. Pero hay áreas en las que no funcionan (como la mecánica cuántica, que es bien conocida por ser extraña y contraintuitiva). Pero, ¿por qué esos axiomas aparentemente sí funcionan en nuestros problemas de probabilidad "comunes" y "cotidianos"? ¿Quizás no hemos descubierto un caso en el que fallen?

Citando a El enfoque lógico-algebraico de la mecánica cuántica Volumen I: Evolución histórica , C.A. Hooker Editor, página 172 :

Es obvio que, dado que los axiomas de Kolmogorov se basan en la experiencia empírica experiencia empírica, cualquier cambio en la teoría, si es que se quiere extender sus aplicaciones al mundo físico, debe surgir directamente de algunas consideraciones fenomenológicas. Anticipando nuestras anticipando nuestras discusiones en las secciones subsiguientes, se podría decir que el punto de punto de partida para el cambio contemplado en el modelo puede ser rastreado a el notable descubrimiento de que los sistemas físicos que surgen en la física cuántica física cuántica son de tal naturaleza que uno ya no tiene derecho a hacer la que la proposición experimental asociada constituya una álgebra sigma booleana. Como consecuencia, el convencional, es decir, el formalismo de Kolmogorov de la teoría de la probabilidad es inadecuado para una descripción precisa de estos sistemas. Como ejemplo espectacular de este Como ejemplo espectacular de este fracaso podemos mencionar el hecho de que la noción de eventos disjuntos es a un nivel algo más profundo y que la identidad $P(A+B)=P(A)+P(B)-P(AB)$ no siempre es cierto (los ejemplos de Feynman se refieren se refieren, entre otras cosas, a este fallo).

0 votos

¿Alguien entiende lo que la frase la noción de eventos disjuntos está en un nivel algo más profundo ¿Significa? Espectacularmente o no...

1 votos

@Did No estoy seguro, pero una posible interpretación podría ser: si $A$ es el $x$ -coordinar y $B$ el $y$ -de un electrón en dos dimensiones, entonces no podemos calcular $AB$ ya que esta medición no es factible por el principio de incertidumbre - por lo que en realidad la noción de $AB$ no tiene ningún significado en este contexto

1 votos

El $x$ - y $y$ -Las coordenadas de un electrón se conmutan y pueden medirse simultáneamente. Para que el comentario anterior sea físicamente correcto se necesita, por ejemplo, la coordenada $x$ y el impulso $p_x$ .

14voto

jmans Puntos 3018

Parece que abordas varios temas a la vez. Pero primero, algunas inexactitudes. Escribes "al crear un sistema de axiomas como estos..." No estoy seguro de a qué se refiere "estos". Luego dices que "es necesario que la lista de axiomas sea completa". ¿Quieres decir con 'completa' que sólo hay un modelo de los axiomas (hasta el isomorfismo)? si es así, ¿por qué es necesario para modelar eventos de probabilidad? Tu comparación con los axiomas de la geometría tampoco está clara. Si se omite el quinto, no se obtiene automáticamente la geometría hiperbólica, también se puede obtener la geometría proyectiva. Afirmar que cualquiera de ellas no es lo que queríamos tener es peculiar, particularmente desde una perspectiva moderna. La geometría abarca mucho más que la geometría euclidiana. Y de nuevo, incluso con la quinta no hay una sola (hasta el isomorfismo) geometría euclidiana, sino infinitas (de varias dimensiones).

Ahora intentaré abordar la cuestión de qué tiene de bueno la axiomatización de Kolmogorov. Las matemáticas de la probabilidad están plagadas de dificultades, tanto conceptuales como técnicas. Hay infinidad de ejemplos de cuestiones aparentemente sencillas que resultan ser muy complicadas o tienen respuestas muy poco intuitivas (la paradoja de Monty Hall, por ejemplo). Problemas que parecen idénticos pueden resultar significativamente diferentes sólo por los cambios en el protocolo. En resumen, no es fácil.

Dicho esto, la teoría de la probabilidad de los espacios de probabilidad finitos es bastante sencilla, al menos en el sentido de que está claro cómo modelar los espacios de probabilidad finitos: Dado un conjunto finito de sucesos, la probabilidad de un subconjunto de sucesos es la relación entre ese subconjunto y el conjunto completo. Dulce. De ello se desprende bastante, pero sólo cuando el conjunto total de sucesos es finito.

A menudo, el conjunto de eventos es infinito. Por ejemplo, la modelización del lanzamiento de un dardo a una diana suele hacerse imaginando la diana como un disco en $\mathbb R^2$ y entonces el lanzamiento de un dardo corresponde a la elección de un punto en el disco. Por supuesto, el disco tiene infinitos puntos. ¿Cuál es la probabilidad de que el dardo caiga en un punto determinado, digamos el centro del disco? Bien, suponiendo que el dardo cae al azar en una distribución uniforme sobre todos los puntos, la única respuesta posible es $0$ . Un punto es demasiado pequeño. Esto ya es bastante contraintuitivo y plantea la cuestión de cómo modelar todo esto. Bueno, todo esto está relacionado con la noción de cuán grande es un conjunto. Una pregunta inocente con una respuesta muy complicada. No es nada sencillo desarrollar la teoría que responde a esta pregunta: la teoría de la medida. Las cuestiones relacionadas con el axioma de elección no tardan en aparecer. Un famoso teorema de Vitali muestra que es imposible (asumiendo el axioma de elección) asignar con sentido una medida a todos y cada uno de los subconjuntos de $\mathbb R$ .

Ahora bien, la teoría de la medida no se desarrolló para proporcionar algunos fundamentos de la teoría de la probabilidad. En cambio, surgió a partir de cuestiones de integrabilidad. La maravillosa visión de Kolmogorov fue que se dio cuenta de que el mismo formalismo puede utilizarse para convertir la intuición de lo que debería ser la teoría de la probabilidad (como dices, axiomas bastante obvios) en axiomas reales. Antes de la teoría de la medida y de la contribución seminal de Kolmogorov, nadie sabía cómo trabajar con sentido y precisión con espacios de probabilidad infinitos. Gracias a Kolmogorov nació un formalismo. Eso sí que es maravilloso.

Por último, el párrafo que citas habla de algo totalmente distinto. Las consideraciones de la mecánica cuántica desafían muchas propiedades conceptualmente obvias. Entre ellas la axiomatización de la probabilidad de Kolmogorov. En el mundo de la mecánica cuántica incluso la probabilidad se comporta de forma diferente a la que estamos acostumbrados. Así es la vida.

0 votos

He editado mi pregunta, explicando lo que quiero decir con "completo" en este contexto..

1 votos

Supongo que el hecho de que un determinado conjunto de axiomas esté de acuerdo con nuestra intuición de, digamos, la probabilidad, debe ser en sí mismo un axioma. No podemos demostrarlo. Los axiomas de Kolmogorov han sobrevivido tantos años sin mayores quejas, luego se cree que coinciden con nuestra intuición en este caso. ¿Está usted de acuerdo con eso?

0 votos

A ti. Pensé que era obvio, lo siento. De todas formas es un comentario a tu respuesta.

3voto

SUMIT MITRA Puntos 16

Kolmogorov se interesó tanto por los axiomas como por la forma en que la probabilidad se realiza en los sistemas. Para esto último, ver este documento .

La probabilidad es notoriamente difícil de axiomatizar correctamente. La probabilidad de Kolmogorov supuso una revolución al sentar las bases de una teoría no sólo rigurosa, sino muy aplicable. El único ejemplo "fácil" similar que se me ocurre es la noción de conjuntos compactos para demostrar cosas en el análisis real.

Los axiomas de Kolmogorov por sí mismos no son nada nuevo. Sin embargo, fue la reinterpretación de Kolmogorov de la probabilidad a través de la teoría de la medida lo que fue verdaderamente revolucionario. Esto permitió una base mucho más amplia y rigurosa para la teoría de la probabilidad. Todo, desde la Ley 0-1 de Kolmogorov, hasta la interpretación de $P(A|B)$ cuando $P(B)=0$ se convierte en algo natural y útil en este enfoque de la teoría de las medidas. Otro ejemplo es el movimiento browniano, cuyos fundamentos rigurosos se basan únicamente en la teoría de las medidas.

Que la teoría de Kolmogorov funcione o no en la mecánica cuántica es una cuestión completamente distinta. La probabilidad cuántica es una generalización, y puedes encontrar formas de conectarla en la teoría de Kolmogorov aquí .

2voto

Hagen von Eitzen Puntos 171160

¿No es la razón de su éxito precisamente el hecho de que los axiomas de Kolmogrov son

  • poco en número
  • simples estacionamientos
  • ¿todo el mundo puede estar de acuerdo?

(Repito aquí los puntos de su declaración, pero su cita no contradice el último de estos puntos).

La cosa se pone un poco problemática cuando hablamos de exhaustividad en este contexto: La intención de los axiomas de Euclides era describir un único objeto abstracto, "la" geometría del "plano" (o "el" espacio 3D). También podríamos preguntarnos: ¿Son completos los tres axiomas de grupo (asociatividad, neutro, inverso)? En cierto sentido no lo son, ya que ni la afirmación $\forall x,y\colon xy=yx$ ni su negación pueden demostrarse a partir de ellos. Pero eso es porque estos axiomas están ahí para describir muchos objetos (es decir, modelos del sistema de axiomas). Y en el otro extremo del espectro hay estructuras que no son grupos (como $\mathbb N$ ) y, por tanto, no se sugieren para ser tratados con métodos de teoría de grupos.

Los axiomas de Kolmogorv pertenecen más bien a la segunda categoría: Son aplicables a muchas situaciones diferentes. Y si $P(A\lor B)=P(A)+P(B)-P(A\land B)$ no se cumple en la vida real, entonces esto no puede ser modelado como probabilidad al igual que $\Bbb N$ no es un grupo.

0 votos

Puede parecer una pregunta tonta, pero ¿por qué diferentes temas matemáticos tienen diferentes axiomas pero se utilizan entre sí? Por ejemplo cuando sumamos probabilidades sumamos números pero los números o la suma y sus axiomas no se postulan en la teoría de la probabilidad.

2voto

Han de Bruijn Puntos 6161

Con respecto a la Probabilidad Mecánica Cuántica, tal vez esta referencia de Wikipedia sea una buena lectura:

Especialmente las secciones   Las leyes del cálculo de las probabilidades de los acontecimientos   y   En el contexto del experimento de la doble rendija   son relevantes. En este último apartado encontramos la fórmula de adición de la complejo amplitudes de probabilidad $\psi$ de dos eventos independientes, digamos $\psi_1$ y $\psi_2$ , no resultando en la probabilidad "común" $P$ : $$ P \ne \left| \psi_1 \right|^2 + \left| \psi_2 \right|^2 $$ Pero en lo siguiente: $$ P = \left| \psi_1 + \psi_2 \right| = \left| \psi_1 \right|^2 + \left| \psi_2 \right|^2 + 2 \left| \psi_1 \right| \left| \psi_2 \right| \cos(\theta_1-\theta_2) $$ Aquí $\,\theta_{1,2}$ son los argumentos (complejos) de $\,\psi_{1,2}$ . El último término es crucial para describir el comportamiento de la Mecánica Cuántica. Es el "nivel más profundo" que se menciona en la pregunta. De hecho, como Richard Feynman dice: "contiene la sólo misterio" ( Las Conferencias Feynman de Física III sección 1-1 ).

Pero la Mecánica Cuántica no es el único contexto en el que la "probabilidad" es diferente de Probabilidad de Kolmogorov . Hay otras dos cuestiones relacionadas con esto que me parecen molestas:

0 votos

¿Está diciendo que se viola uno de los axiomas de Kolmogorov? De la página de Wikipedia que usted cita, el tercer axioma sobre la suma de probabilidades de mutuamente excluyentes se afirma que se aplica a las amplitudes de probabilidad cuántica (véase la sección sobre las leyes de cálculo de las amplitudes de probabilidad). No hay ninguna regla en los axiomas de Kolmogorov que exija que las probabilidades de independiente los eventos se suman.

0voto

William Balthes Puntos 14

Obsérvese que, como se ha dicho, la "regla" mencionada tiene múltiples interpretaciones. $$(A) P(A\vee B)=P(A)+P(B)P(AB)$$ como lo establece un axioma del sistema de Kolmogorov.

A menos que usted interprete $$P(AB)$$ como $P(A\cap B)$ como intersección teórica de conjuntos, que es como se hace, o se hacía, tradicionalmente.

Dónde $A\cap B$ es el evento $E;E \in F$ .

$F$ siendo el álgebra Bool-ean de los eventos.

Dónde está el evento $E$ es, denotado por un conjunto de eventos atómicos:

$\Omega_{i};\Omega_{i} \in \Omega$ generalmente, si no siempre, se excluyen mutuamente, donde $\Omega$ es el espacio muestral .

O lo que es lo mismo, la unión de conjuntos únicos: $\{\Omega_{i}\} \in F, \{\}$ denotando dichos eventos atómicos, que suelen ser medibles en casos finitos, y por tanto $\in F$ el "álgebra booleana o sigma de los eventos medibles". Este ser es a menudo, la unión de los conjuntos unicolores (traducir , disyunción, de 'eventos atómicos mutuamente excluyentes') , que están en la intersección común de los conjuntos $E_{A}\,,E_{B}$ .

Se trata de la unión de conjuntos únicos en ${\Omega_{i}}\in F$ (traducir, disyunción, de 'eventos atómicos mutuamente excluyentes'; $\Omega_{i}\in \Omega$ ), ' que denota los acontecimientos $A , B$ respectivamente.

Así que al final del día, uno nunca considera eventos compuestos realmente, en el cálculo básico de Kol-mogorov, que no son mutuamente excluyentes.

Con esto quiero decir que siempre son reducibles a desuniones de eventos mutuamente excluyentes. Mientras que algunos eventos en $F$ pueden no ser mutuamente excluyentes, en qué consisten esos eventos.

Es decir, los elementos de los conjuntos que denotan cada evento individualmente, son generalmente si no siempre mutuamente excluyentes, son, por lo que no hay composiciones (intersección de la unión )o eventos que consisten en eventos atómicos no mutuamente excluyentes, u otras particiones.

A menos que cuente $\emptyset$ .

Por lo demás, la unión de conjuntos unitarios, o eventos atómicos, o particiones contables de los mismos (uniones) en los casos infinitos, suelen analizarse siempre en teoría de conjuntos a través de la unión disjunta, y el conjunto co de eventos mutuamente excluyentes, y la complementación de conjuntos así lo hará $A\cap B$ .

Aunque el cálculo de la probabilidad fue, en cierto sentido, ampliado más tarde, tanto por Kol-mogorov como por otros, tal como está, los tres axiomas de la probabilidad $(1)$ , $(2)$ y $ (3)$ no contienen $$(A)$$ al menos no explícitamente.

Todo se puede hacer sumando sólo eventos mutuamente excluyentes. Es sólo una herramienta teórica más rápida.

Tal vez la verdadera diferencia sea, no tanto a nivel de axiomas, la naturaleza del espacio de probabilidad. Sin embargo, la teoría del modelo subyacente, la lógica, la teoría de la medida y los conjuntos, por un lado, frente a las funciones, los espacios vectoriales y los productos internos, y lo que se entiende por disjuntos, y complementarios y de cierre bajo uniones de ciertas formas

Véase el capítulo 5 de 'Foundations of Measurement Volume 1: Suppes Krantz, Luce et al para más información sobre la distinción en la mecánica cuántica.

y la que la probabilidad cuántica puede considerarse no conmutativa, y puede ver una distinción en la lógica entre los eventos(1) y (2): $(1)P([A\cup B ]\vee [B\cup C])$ y $(2)PR(A\vee B \vee C)$ .

Dónde $A\cap B$ y $B \cup C=\emptyset $ .

Pero, en el sistema convencional (como kolmogorov), $P([A \vee B ]\land [B\vee C])$ se interpreta, teóricamente, como: $ P([A\cup B ]\cap [B\cup C])=P({B})$ por ejemplo.

Dónde $A , B C$ son los eventos atómicos, mutuamente excluyentes y exhaustivos.

Así, el cálculo de la probabilidad, en realidad sólo contiene $$(2)$$ interpretado en términos de intersección, complementación y unión en teoría de conjuntos.

Aunque generalmente la intersección no es necesaria dadas las especificaciones de la unidad.

$A\cap B$ generalmente será un evento $\in \mathbb{F}\subseteq=2^{\Omega}$ en el álgebra de los acontecimientos $F$ . Es un conjunto de resultados elementales mutuamente excluyentes ${D,C...}$ o un conjunto único, ${D}$ \en $F$ , $D$ \en $\Omega$ un suceso atómico, singleton, o la unión de dichos sucesos mutuamente exhaustivos, generalmente, en el álgebra de sucesos, al igual que cualquier otro suceso, generalmente $A\cap B=$ ,cantan la complementación de la teoría de conjuntos.

Además, $P(AB)$ es no Interpretado como algún tipo de producto o evento multiplicativo es siempre o bien una unión de eventos atómicos, o bien el evento vacío o el evento unitario al fin y al cabo, cuando se utiliza la intersección teórica de conjuntos para un espacio de probabilidad singular.

En el álgebra no hay más eventos de producto distintos que estos.

$$(1)P(A \vee B)=P(A)+P(B)P(A\land B)$$ . $$(2)P(A\cup B)=P(A)+P(B)P(A\cap B)$$ .

Se ha debatido si el conjunto de axiomas original de Kolmorogov es incompatible con la mecánica cuántica.

Tal vez su extensión oficial a la teoría de la medida, a las álgebras conjuntas, a los conjuntos producto, a las leyes definitivas de los grandes números, a la independencia, etc. Pero los axiomas originales no dicen nada al respecto.

Muchos de los contraejemplos que he mencionado en otros artículos no tienen nada que ver con la formulación oficial de Kolmogorov, que no dice nada sobre los productos, la independencia, el axioma de Bayes o los "axiomas" multiplicativos/de producto.

Que se plantean como meras definiciones, y por definición esto significa que:

$P(A|B)$ es una palabra que simplemente denota $\frac{P(AB)}{P(B)} .

Dónde $P(A|B)=\frac{P(AB)}{P(B)}$ entonces dice que el cociente de dos probabilidades $\frac{P(AB)}{P(B)} =\frac{P(AB)}{P(B)}$ es igual al cociente de las mismas dos probabilidades (es decir, nada sustantivo).

Esto se debe a que, las probabilidades condicionales, no son explícitamente parte de la estructura axiomática derivada de la interpretación teórica de la medida de la probabilidad, si se puede llamar así.

A diferencia de la aditividad de las probabilidades sobre uniones disjuntas, que se "derivó" de la aditividad de la inter-pretación subyacente (medida).

Tampoco, $P(A|B)$ La probabilidad de un par condicional, al menos en el cálculo canónico de la probabilidad. Tampoco lo son las definiciones de independencia y regla de Bayes (definición realmente).

Esto, la independencia, la regla de Bayes, las probabilidades condicionales, etc., no son oficialmente axiomas del sistema de Kol-mogorov.

Es posible que haya habido razones para que Kolmorogov no publicara oficialmente sus resultados antes, que se publicaron más o menos al mismo tiempo que la lógica de la probabilidad cuántica de Von Neumann/Birk-hoff, etc. Estos trabajos, tienen la misma cosecha oficial.

Kol-mogorov, puede haber sido consciente de algunos de los problemas. Tal vez, parte de la razón por la que se mostró reticente a considerar o formalizar la definición de producto, la regla de Bayes y la independencia, como axiomas de la probabilidad.

Aunque Kol-mogorov nunca incluyó oficialmente estos axiomas, sino sólo definiciones, el cálculo de la probabilidad fue ampliado más tarde, tanto por él como por otros, para dar cabida a la regla de Bayes y situarla en una posición axiomática más formal.

Sin embargo, tal y como están las cosas, los tres axiomas de la probabilidad siguen sin contenerla (regla de Baye) ni la independencia, y por tanto la "regla del producto" , $(2)$ o la regla de la "probabilidad total", $(1)$ como a continuación, como axiomas:

$$(1)P(A \\vee B)=P(A)+P(B)P(A\land B)$$ .

$$(2)P(A\cup B)=P(A)+P(B)P(A\cap B)$$ .

El único uso oficial de es $(2)$ como un axioma, donde aproximadamente : $P(A\cup B)= P(A\\B)+P(B)$ . Pero esto no hace uso de las nociones de definiciones de probabilidades condicionales, multiplicidad de probabilidades como en la regla del producto, o independencia.

Axiomas: Donde un espacio de Probabilidad es un triple : $$\langle \Omega,\mathbb{F}, P\rangle$$ .

Dónde, $\Omega$ es el espacio muestral, el conjunto de sucesos atómicos mutuamente excluyentes y exhaustivos, ,a menudo llamados sucesos de una sola tonelada, $\in$ el álgebra $\mathbb{F} $ . Donde, $\mathbb{F} \subseteq \mathcal{P(\Omega)}=2^{\Omega}$ es un evento del álgebra de Bool-ean, un conjunto de subconjuntos medibles, de $\Omega$ , cerrado bajo el evento de la unidad (evento determinado: $\Omega$ , la complementación y la unión contable.

$$(1)P(E)\in \mathbb{F} ,P(E)\geq 0\quad \forll E\in F$$ $$(2) P(\Omega)=1$$ .

$$(3)P (^{i=\infty}_{i=1}E_{i}) = $$ . $$\lim_{n \to \infty} ^{i=n} _{i=1}P(E_{i})$$ .

Dónde: $\forall A_{i}$ son mutuamente excluyentes. Es decir, son disjuntos por pares.

Una secuencia contable de , conjuntos disjuntos por parejas, que requiere un axioma de continuidad, y a veces se formaliza como cuarto axioma distinto de la aditividad finita.

Si se lee la obra principal de Kol-mogorov, enuncia muchos axiomas tentativos como el axioma $4|5$ el principio de frecuencia que al final decidió rechazar .

Aunque Kol-morogov es considerado a menudo como frecuentista en ciertos círculos, al final rechazó el frecuentismo formal de Von Mises/Reichen-bach, al igual que Von -Neumman en la Mecánica Cuántica. Dijo explícitamente que su modelo no tenía mucho que decir, o era neutral sobre el mundo, y que los datos de frecuencia, es como se obtiene la información, pero formalmente hablando lo rechazó al final.

Any countable sequence of disjoint sets:

con eventos mutuamente excluyentes, aproximadamente: $E_{1} ,\, E_{2} \text{..}\in F$ , satisface:

. $$P(_{i=1}^{\infty}E_{i})= \, \sum_{i=1}^{\infty }P(E_{i}\,)$$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X