7 votos

¿Es la probabilidad y la Ley de los Grandes Números un enorme argumento circular?

Siempre me ha confundido esta parte de la probabilidad. Mi definición (¿ingenua?) de probabilidad parece ser $Pr(X=x)=p$ significado por término medio, $X$ sería igual a $x$ en una proporción $p$ del tiempo, a medida que el número de ensayos llega a infinito.

Sin embargo, esto parece ser lo que dice la Ley de los Grandes Números, y esa Ley es un teorema, no un axioma o definición de probabilidad.

Qué en realidad ¿Qué es la probabilidad, si no un replanteamiento de la Ley de los Grandes Números? Esto siempre me ha molestado: la probabilidad parece un enorme argumento circular. ¿En qué me equivoco?

6voto

SUMIT MITRA Puntos 16

Estás confundiendo teoría de la probabilidad con el probabilidad . La teoría de la probabilidad es una rama de las matemáticas con axiomas que definen nociones de probabilidad en términos de conceptos procedentes principalmente de la teoría de la medida. Se tiene un espacio de estados $\Omega$ de singleton $\omega\in \Omega$ Eventos $A\subset \Omega$ etc. Se define el concepto abstracto de medida de probabilidad. Se define la independencia, etc. A priori, estas definiciones y reglas no tienen cabida en el mundo real.

Por otra parte, la probabilidad en sí es un conjunto de interpretaciones de lo que realmente es la probabilidad. Hay frecuentistas y bayesianistas. Más adelante hablaremos de ello.

Consideremos el ejemplo de lanzar una moneda, cuyo resultado es cara o cruz. Puede ser axiomatizado como sigue: Existe un espacio de estados $\Omega=\{H,T\}$ que representa los resultados de las monedas, cara o cruz. Existe una variable aleatoria $X$ que es 1 si la moneda sale cara, 0 si sale cruz. $X$ es un mapa de $\Omega$ a $\mathbb{R}$ que es la definición de una variable aleatoria. Decir que la moneda tiene probabilidad $p$ de caer sobre cabezas es decir que $P(X=1)=P(\omega: \omega\in \Omega, \ X(\omega)=1)$ .

$P$ es un medida de probabilidad que es una función de $\Omega$ a $[0,1]$ que satisface ciertos axiomas. Obsérvese que se ha hecho absolutamente cero uso de cualquier tipo de interpretación de lo que $p$ realmente es, aparte de sólo un número. Utilizando esto y otros resultados, se puede derivar la Ley de los Grandes Números, que en tu contexto dice que si lanzas una moneda $n$ veces, independientemente con $X_i$ que significa $i$ 'th resultado, entonces $P(|\frac{1}{n}\sum_{i=1}^nX_i-p|>\epsilon)\rightarrow 0$ para cada $\epsilon>0$ . Hay versiones más fuertes de esto, pero el punto heurístico es que el número medio de cabezas converge a $p$ donde la noción de convergencia es con respecto a la función $P$ que he intentado destacar.

Ahora supongamos que coges una moneda y la lanzas en el mundo real. Por ejemplo, digamos que es una moneda justa ¿Qué significa eso? Depende de la escuela de probabilidad a la que pertenezcas. La forma frecuentista sería lanzar la moneda un montón de veces y observar la frecuencia de caras. Si obtienes aproximadamente 1/2 después de muchos lanzamientos, te convences de que la moneda es justa. Así que $p=1/2$ . Esta es ahora una definición para $p$ puramente en términos de resultados. $p$ =(Número de Cabezas)/(Número Total de Lanzamientos). Ahora se dice que la probabilidad de que salga cara en el siguiente lanzamiento es $1/2$ lo que significa que si si lanzara la moneda varios miles de veces, esperaría que aproximadamente la mitad de los resultados fueran cara.

3voto

user87400 Puntos 120

La respuesta a qué probabilidad es sólo puede ser un punto de vista -el mío lo es: la probabilidad es un concepto matemático abstracto. Se ha axiomatizado de diferentes maneras. La axiomatización que prevalece y que casi todo el mundo utiliza hoy en día es la formulada por Kolmogorov (años 30) en el contexto de la teoría de las medidas. Como concepto matemático bien definido, puede utilizarse para modelizar y analizar cualquier fenómeno del mundo real que tenga una estructura acorde con sus propiedades.

La segunda parte de la pregunta puede tener una respuesta verdadera y no un punto de vista: La Ley de los Grandes Números no dice tal cosa: dice que (dadas las diversas condiciones de regularidad), "el valor medio de una colección de variables aleatorias tenderá al valor medio de sus valores medios" - y esta afirmación se expresa en términos de su probabilidad de ser cierta: el concepto de probabilidad no entra en las premisas del teorema, el enunciado del teorema no afirma algo sobre la probabilidad - más bien, el concepto de probabilidad califica la afirmación del teorema Nada circular aquí.

2voto

kerchee Puntos 66

La ley de los grandes números no es una afirmación sobre la probabilidad en el sentido intuitivo, sino sobre funciones que satisfacen los axiomas de Kolmogorov. Tales funciones no tienen por qué tener nada que ver con frecuencias o estadísticas.

Por ejemplo, consideremos el intervalo $[0, 1]$ . Definir una función $L$ en subconjuntos medibles de este intervalo mediante $L(A)=\text{length of $ A $}$ . Nótese que no estoy imponiendo ningún tipo de interpretación sobre $L$ como una "probabilidad", como la probabilidad de acertar $A$ si lanzaras un dardo en el intervalo, o algo así. Es sólo la longitud geométrica, pero sin embargo es fácil ver que satisface los axiomas de Kolmogorov. Ahora, bajo la función $L$ resulta que $d_n(x) = \text{the $ n $-th binary digit of $ x $}$ define una secuencia de variables aleatorias i.i.d. Bernoulli, cada una con "probabilidad" $0.5$ que en nuestro caso sólo significa que la longitud del conjunto en el que $d_n=1$ es $0.5$ . La ley de los grandes números nos dice ahora que la longitud del conjunto de números cuyas expansiones binarias tienen igual proporción asintótica de unos y ceros es $1$ . Fíjate en que la estadística no entra en escena: sólo hacemos geometría.

Podemos intentar relacionar los axiomas de Kolmogorov con las frecuencias diciendo algo así:

Considera algún experimento repetible. Para decir que un conjunto dado de resultados tiene probabilidad $p$ significa que si se repite el experimento un número muy grande de veces, se obtendrá un resultado en ese conjunto aproximadamente $p$ del tiempo.

Cómo podemos justificar tal predicción es una cuestión aparte. La cuestión es: si do asuma esta predicción, ¿qué puede deducirse de ella?

Si asumimos lo anterior, entonces la función $P(A) = \text{long term frequency of $ A $}$ satisface los axiomas de Kolmogorov.

Como señalas, esto parece equivalente a asumir simplemente la ley de los grandes números. Pero eso no es muy el caso. En realidad, la LLN nos permite relajar ligeramente la predicción anterior.

Supongamos que queremos aplicar el LLN al lanzamiento de una moneda. En ese caso, el "experimento repetible" en cuestión es el experimento de "lanzar una moneda un gran número de veces", llamémosle "serie de lanzamientos". La LLN es entonces un enunciado sobre las funciones de Kolmogorov en el conjunto de todos los resultados posibles de la serie de lanzamientos.

Ahora, por supuesto, si asumimos que si lanzamos la moneda un gran número de veces, obtendremos cara aproximadamente la mitad de las veces, esto es equivalente a asumir el LLN. Pero gracias a la LLN, podemos suponer algo ligeramente más débil que eso, y obtener la LLN como consecuencia lógica. A saber, sólo necesitamos la siguiente suposición:

Si realizo un gran número de series de flip, y sólo miro los resultados de las $n$ -ésima moneda cada vez, entonces esa moneda saldrá cara aproximadamente la mitad de las veces.

Esencialmente, si realizas muchas muchas series de flip, y representas los resultados en una tabla donde cada fila es una serie, así:

$$ HHHHTTHTHTTTHTHHHTH... \\ TTHTHHTHHTHTHHTHTHT... \\ THHHTHTHTHHTHTHHHTT... \\ THTHTHHTHTHTHTHTHHT... \\ THTHTHTHTHHTHTHHTHT... \\ \vdots $$

Entonces la suposición que estás haciendo es que hay aproximadamente $50\%$ cabezas en cada columna y el LLN (si también se hace el supuesto de independencia) permite concluir que, por lo tanto, también hay aproximadamente $50\%$ cabezas en cada fila .

Hay que admitir que si vas a hacer una suposición sobre la $n$ -ésima moneda lanzada en la serie, parece que también se puede hacer la misma suposición acerca de la propia serie de lanzamientos. Pero recuerde que el hecho de que las variables aleatorias sean i.i.d. no significa que tengan que representar el mismo experimento físico. Por ejemplo, imagina que tienes una gran caja con montones de monedas diferentes, y que todas están numeradas, por lo que se pueden distinguir. En ese caso, la LLN le permite convertir un conjunto de suposiciones sobre las monedas individuales en una conclusión sobre todas las monedas en conjunto.

0voto

En mi opinión, las otras respuestas no lo entienden, los axiomas de Kolmogorov son tan débiles en el sentido matemático que, aunque se puede deducir la ley de los grandes números a partir de ellos, no hay nada en los axiomas que permita interpretarla de la forma habitual (de hecho, la probabilidad no se define en los axiomas, por lo que no se puede dar ninguna interpretación al teorema) y, en sentido estricto, se acaba con una afirmación casi sin sentido sobre números "puros" que simplemente satisfacen esos axiomas débiles. Las variables del teorema tienen el significado que se les suele atribuir ("media", "varianza", "probabilidad") sólo si se hacen suposiciones adicionales, y parece que la suposición necesaria es precisamente la propia ley de los grandes números. Esto lo dice más o menos el propio Kolmogorov:

Aplicamos la teoría de la probabilidad al mundo real de la experimentación de la siguiente manera:

...

4) En determinadas condiciones, que no analizaremos aquí, podemos suponer que al suceso A, que puede ocurrir o no en las condiciones S, se le asigna un número real P(A) que tiene las siguientes características:

a) Se puede estar prácticamente seguro de que si el complejo de condiciones S se repite un gran número de veces, n, entonces si m es el número de ocurrencias del suceso A, la relación m/n diferirá muy poco de P(A).

Lo único que se aprende al derivar la LLN puramente matemática de los axiomas de Kolmogorov, es que establece la consistencia matemática entre esta suposición adicional y los otros axiomas, no surge ninguna contradicción lógica. A todos los efectos prácticos, la LLN es una suposición sobre lo que es P() y no un teorema.

He intentado verificar este entendimiento aquí:

¿Permiten los axiomas de Kolmogorov hablar de frecuencias de aparición en algún sentido significativo?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X