25 votos

¿Qué es exactamente una medida de probabilidad en palabras simples?

¿Alguien puede explicar la medida de probabilidad en palabras simples? Este término me ha estado persiguiendo toda mi vida.

Hoy me encontré con divergencia de Kullback-Leibler. La divergencia de KL entre la medida de probabilidad P y Q se define como,

$$KL(P,Q)= \begin{cases} \int \log\left(\frac{dP} {dQ}\right)dP & \text{si}\ P\ll Q, \\ \infty & \text{en otro caso}. \end{cases}$$

No tengo idea de lo que acabo de leer. Busqué medida de probabilidad, se refiere al espacio de probabilidad. Busqué eso, se refiere a $\sigma$-álgebra. Me dije a mí mismo que tenía que parar.

Entonces, ¿una medida de probabilidad es simplemente una densidad de probabilidad pero dicho de una manera más amplia y elegante? ¿Estoy pasando por alto un concepto simple, o este tema es simplemente tan difícil?

24voto

Pawel Puntos 28

Un espacio de probabilidad consta de:

  1. Un espacio muestral $X$, que es el conjunto de todos los posibles resultados de un experimento
  2. Una colección de eventos $\Sigma$, que son subconjuntos de $X
  3. Una función $\mu$, llamada medida de probabilidad, que asigna a cada evento en $\Sigma$ un número real no negativo

Consideremos el ejemplo simple de lanzar una moneda. En ese caso, tenemos $X=\{H,T\}$ para caras y cruces respectivamente, $\Sigma=\{\varnothing,\{H\},\{T\},X\}$, y $\mu(\varnothing)=0$, $\mu(\{H\})=\mu(\{T\})=\frac{1}{2}$ y $\mu(X)=1$. Todo esto es una manera elegante de decir que cuando lanzo una moneda, tengo un $0$ por ciento de probabilidad de no lanzar nada, un $50$ por ciento de probabilidad de lanzar caras, un $50$ por ciento de probabilidad de lanzar cruces y un $100$ por ciento de probabilidad de lanzar algo, caras o cruces. Todo esto es muy intuitivo.

Ahora, volviendo a la definición abstracta, hay ciertos requisitos naturales que $\Sigma$ y $\mu$ deben cumplir. Por ejemplo, es natural exigir que $\varnothing$ y $X$ sean elementos de $\Sigma$, y que $\mu(\varnothing)=0$ y $\mu(X)=1$. Esto simplemente significa que al realizar un experimento, la probabilidad de que ningún resultado ocurra es $0$, mientras que la probabilidad de que algún resultado ocurra es $1$.

De manera similar, es natural exigir que $\Sigma$ esté cerrado bajo complementos, y si $E\in\Sigma$ es un evento, entonces $\mu(E^c)+\mu(E)=1$. Esto simplemente significa que al realizar un experimento, la probabilidad de que el evento $E$ ocurra o no ocurra debe ser $1$.

Existen otros requisitos de $\Sigma$ que lo convierten en una $\sigma$-álgebra, y otros requisitos de $\mu$ que lo convierten en una medida (finita) de medida, y para estudiar la probabilidad rigurosamente, uno eventualmente debe familiarizarse con estas nociones.

6voto

Hagen von Eitzen Puntos 171160

Para describir una variable aleatoria $X$, especificamos cuál es la probabilidad de que el resultado de $X$ sea algún valor $x$. Por ejemplo, con un dado justo y $X$ representando "la puntuación de un lanzamiento del dado", diríamos $$P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=\frac16$$ y ya está. Nuestro $X$ toma valores solo del conjunto finito $\Omega=\{1,2,3,4,5,6\}$.

También hay variables aleatorias con un número (contablemente) infinito de resultados posibles. Por ejemplo, si $Y$ representa "el número de lanzamientos de una moneda justa hasta que aparezca cara por primera vez", entonces $$P(Y=1)=\frac12, P(Y=2)=\frac14, P(Y=3)=\frac18,\ldots $$ El conjunto $\Omega$ de resultados posibles es ahora $\Omega=\mathbb N$.

Y finalmente hay variables aleatorias con un número incontable de resultados posibles (por ejemplo, dejemos que $Z$ represente "seleccionar un punto aleatorio de forma uniforme en el intervalo unitario $\Omega:=[0,1]$"). En estos casos, por lo general para cualquier valor individual $x\in\Omega$, la probabilidad $P(Z=x)$ es simplemente cero. En su lugar, tenemos probabilidad positiva solo si preguntamos por ciertos subconjuntos infinitos del espacio de resultados posibles $\Omega$. Por ejemplo, podemos decir con razón $P(\frac12< X<\frac23)=\frac16$. Sería bueno si pudiéramos asignar un valor de probabilidad a cualquier subconjunto $S\subseteq \Omega$. Sin embargo, por lo general resulta que esto no es posible de manera coherente o bien definida. Aun así, se seguirá esforzando en hacer que la colección de conjuntos $S$ para los cuales $P(X\in S)$ esté definido/definible sea lo más grande posible. Para nuestro ejemplo de $Z$, ciertamente podemos decir que $P(X\in S)=b-a$ si $S$ es un intervalo $[a,b]$ o $]a,b[$ o $]a,b]$ o $[a,b[$ con $0\le a\le b\le 1$. Especialmente, $P(X\in\emptyset)=0$ y $P(X\in\Omega)=1$. Además, si $A,B$ son disjuntos y $P(X\in A)$ y $P(X\in B)$ tienen sentido, entonces también tiene sentido $P(X\in A\cup B)$, a saber, con el valor $P(X\in A\cup B)=P(X\in A)+P(X\in B)$. De hecho, si tenemos conjuntos $A_1,A_2,\ldots$ y conocemos $P(X\in A_n)$ para cada $n$, entonces resulta ser aconsejable tener $$P(\bigcup_{n=1}^\infty A_n)=\sum_{n=1}^\infty P(X\in A_n).$$ Esto es casi el concepto de una $\sigma$-álgebra: es una colección de subconjuntos de un conjunto dado $\Omega$. Si tenemos suerte, como en el caso finito o el caso contable (al menos como ocurrió con la variable aleatoria $Y$ que definimos) esta colección es el conjunto de partes completo de $\Omega$, pero puede ser más pequeño. En cualquier caso, es lo suficientemente grande como para estar cerrado bajo ciertas operaciones, entre las cuales está la unión contable de conjuntos. Y esta propiedad es precisamente lo que nos permite formular las propiedades esenciales que queremos tener para las probabilidades de que una variable aleatoria esté en un subconjunto de $\Omega$. Cualquier función que asigne a cada elemento de una $\sigma$-álgebra dada (es decir, a cada subconjunto lo suficientemente agradable de $\Omega$) un valor entre $0$ y $1$ inclusivo, de modo que las reglas básicas como se han descrito anteriormente se cumplan para las uniones contables, complementos, el espacio completo, se llama entonces una medida de probabilidad.

Una medida importante es la medida de Lebesgue $\lambda$ en $[0,1]$ (que describe la variable aleatoria $Z$ anteriormente). Tal vez la conozcas por la teoría de la integración, donde nos permite generalizar (extender) la integración de Riemann. Por ejemplo, sabrás que el valor esperado de una variable aleatoria finita se da simplemente por $$\tag1E(X) = \sum_{x\in\Omega}x\cdot P(X=x) $$ o más generalmente, el valor esperado de una función de $X$ $$\tag2E(f(X)) = \sum_{x\in\Omega}f(x)\cdot P(X=x).$$ Estas son simples sumas finitas (por lo tanto, siempre funcionan) si $X$ es una variable aleatoria finita. Si $\Omega$ es contable, podemos usar las mismas fórmulas, pero tendremos series en lugar de sumas, y puede suceder que la serie no converja. Por ejemplo $E(Y)=2$, pero $E((-2)^Y)$ no converge. Se vuelve aún peor cuando $P(X=x)=0$ para todos $x\in\Omega$, ya que las sumas/series anteriores simplemente resultan en $0$. Las sumas/series simplemente se reemplazan con integrales correspondientes $$E(Z)=\int_0^1 x\,\mathrm dx =\frac12, \qquad E(f(Z))=\int_0^1 f(x)\,\mathrm dx.$$ Nuevamente, la segunda integral no tiene sentido para cada posible $f$, debe ser integrable.

El paso de la suma a (primero la serie y luego) integral puede parecer arbitrario, pero en realidad está bien fundamentado en teoría de la medida: a menudo se ajusta en la otra dirección y también se escriben series y sumas como integrales (con respecto a medidas específicas).

Todo esto aún puede no ser suficiente para comprender la fórmula que publicaste, pero debería ayudarte a comenzar con los textos introductorios que ya intentaste leer.

3voto

david Puntos 179

Tal vez pueda ayudar a clarificar las cosas un poco sin entrar en detalles técnicos.

Un espacio de probabilidad es simplemente la colección de todos los eventos posibles que pueden ocurrir. Entonces, si estás lanzando una moneda, el espacio de probabilidad $\Omega = \{H, T\}$ ya que solo puedes obtener cara o cruz. La $\sigma$-álgebra que se mencionó también es conceptualmente simple: agrupa todos los eventos en tu espacio de probabilidad en un nuevo conjunto (por supuesto, una $\sigma$-álgebra tiene ciertas propiedades, pero por simplicidad estoy omitiéndolas). Por lo tanto, un ejemplo de una $\sigma$-álgebra $F$ en $\Omega$ sería el conjunto potencia de $\Omega$ (conjunto de todos los subconjuntos) $F = \{\emptyset, \{H\}, \{T\}, \{H,T\}\}$.

La razón por la que la $\sigma$-álgebra es importante es porque es el conjunto de eventos a los que una medida de probabilidad asigna pesos. Por lo tanto, un espacio medible $(\Omega, F, P)$ es un espacio de probabilidad combinado con una $\sigma$-álgebra en ese espacio, y una medida de probabilidad P en la $\sigma$-álgebra.

Entonces, una medida de probabilidad simplemente asigna pesos (probabilidades) a cada conjunto dentro de la $\sigma$-álgebra, donde todos estos pesos deben sumar 1, y algunas otras propiedades (por ejemplo, aditividad acumulativa).

2voto

usul Puntos 1168

Una medida de probabilidad es más parecida a una función de distribución acumulativa.

Da, para cualquier conjunto de valores, la probabilidad de que la variable aleatoria esté en ese conjunto. Y, por supuesto, debe estar definida de una manera que tenga sentido: si $A \cap B = \emptyset$, entonces $\mu(A \cup B) = \mu(A) + \mu(B)$, y la probabilidad de todo el rango es uno, y ningún conjunto tiene una probabilidad negativa.

De acuerdo en que Wikipedia hace un mal trabajo al transmitir las ideas básicas; parece estar escrito por expertos para expertos y muy cargado de tecnicismos en muchos casos....

Pictóricamente, quizás imagina que tienes muchos elementos, y una medida de probabilidad es una escala que te dice el peso de cualquier subconjunto. El peso total de todo lo que tienes siempre es uno. Si pones un par de elementos en la balanza por separado uno por uno, la suma de sus pesos será la misma que si los pesaras todos juntos de una vez.

Ocurre algo curioso con los granos de arena: cada uno tiene un peso individual de cero, pero cuando juntas un tarro de ellos (¡piensa en un número incontable, eso es importante!), entonces pueden tener un peso total mayor que cero.

Imagina que los granos de arena aquí son un número incontable en total, como los números reales en un intervalo. Lo anterior no es cierto si solo hay un número contable! Pero para los números reales, por ejemplo, cada número en el intervalo tiene una medida de probabilidad de cero, pero todo el intervalo tiene alguna medida positiva.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X