Representación gráfica de la distribución de funciones es una forma estándar para visualizar las distribuciones que hace "$\overset{d}{=}$" casi trivial a entender. Lo que es realmente necesario en este contexto, sin embargo, es una comprensión de cómo la adición de dos variables aleatorias cambios en sus funciones de distribución. Esta respuesta se desarrolla la comprensión por la que se explican los conceptos por medio de visualizaciones. El resultado es algo sorprendente: una Wikipedia reclamación acerca de la relación entre dominancia estocástica y equivalencia en la distribución parece estar equivocado.
La visualización de las variables aleatorias
Por definición, una variable aleatoria es un (medibles) con un valor real de la función definida sobre un espacio muestral $\Omega$ ("Omega"). Una forma común para visualizar funciones es gráfico ellos en un par de ejes. Los puntos en uno de los ejes representan los elementos de $\Omega$ (el dominio), mientras que los puntos en el otro eje representan los posibles valores de una función puede tomar en (el rango). Aunque convencionalmente un eje horizontal que se utiliza para el dominio, por razones que pronto se hará evidente voy a dedicar la vertical del eje de esta función, reservándose el eje horizontal para representar el intervalo (todos los números reales).
Como un ejemplo, vamos a $\Omega = \{a, b, c, d\}$ ser un conjunto de cuatro resultados posibles de un experimento. Suponga que todos los subconjuntos medibles (puede tener las probabilidades asociadas con ellos). Supongamos que la variable aleatoria $X$ asigna los valores $2$, $4$, $5$, y $5$ a estos resultados, respectivamente. A continuación, la parte superior del panel de la izquierda de la figura, "Variable Aleatoria X," es un gráfico de $X$. Los centros de los puntos de color azul localizar los valores de $X$ por cada elemento de a $\Omega$.
La visualización de las probabilidades
Una variable aleatoria existe independientemente de cualquier medida de probabilidad en $\Omega$. Para este ejemplo, que postulan una medida $\mathbb{P}$ en que $b$, $c$, y $d$ tienen iguales probabilidades de $1/5$ pero $a$ tiene el doble que la de la probabilidad, $2/5$. Me ha representado que la medida haciendo que las áreas de los puntos en la gráfica directamente proporcional a las probabilidades. El área total de los cuatro puntos, por tanto, se toma como unidad (una probabilidad de $1$).
Funciones de distribución de probabilidad
La función de distribución acumulativa (CDF) $F_X$ de una variable aleatoria $X:\Omega\to\mathbb{R}$ se determina mediante el barrido de todo el valor de ($\mathbb{R}$) del eje de la $-\infty$ $\infty$en la gráfica de $X$. El área total de los puntos levantados en la gráfica de $X$ $-\infty$ punto $x$ (incluyendo $x$) es el valor de $F_X(x)$. Esto se ilustra en la mano izquierda de los paneles. Debido a que el valor del eje es horizontal, el barrido se efectúa de izquierda a derecha. La región en el gráfico que ya ha sido barrido en $x=4.5$ está en la sombra. El total de la zona de sombra cubre un gran punto para $a$ ($\mathbb{P}(\{a\})=2/5$) y un pequeño punto de $b$ ($\mathbb{P}(\{b\})=1/5)$). El total de la probabilidad de barrido hasta el momento es $3/5$. Por lo tanto, como se muestra en la parte inferior izquierda del gráfico "CDF", donde podemos visualizar que la izquierda-a-derecha barrido que ocurren en tándem con el barrido en el gráfico superior, el valor de $F_X(4.5)$ es igual a $3/5 = 0.6$. (Esta es la razón por la que hice el valor del eje horizontal de la gráfica de $X$, ya que nos permite visualizar este proceso de barrido mediante un convencionales gráfico de la CDF, donde el eje es horizontal y la probabilidad de eje vertical.)
(De primer orden) de dominancia estocástica
El derecho de los paneles de utilizar estos métodos para mostrar la misma variable aleatoria $X$ junto con otra variable aleatoria $Y$ (definido en el mismo conjunto $\Omega$) que domina. Por definición, $X$ domina $Y$ $F_X(x) \le F_Y(x)$ para todos los valores de $x$ y, al menos para algunos valores $x$, $F_X(x) \ne F_Y(x)$. Gráficamente, esto significa que el sólido azul y líneas de puntos en la parte inferior derecha del panel ("CDFs de X y de y") siempre se encuentran en o por debajo de las líneas de guiones rojas y puntos.
Porque un CDF nunca puede disminuir (probabilidad sólo puede ser añadido durante el proceso de barrido, nunca la abandonó), este geométricas hecho es equivalente a la gráfica de $F_X$ mintiendo a la derecha de la gráfica de $F_Y$. En comparación con $Y$, $X$ se desplaza hacia valores más altos. Observe, sin embargo, que el $X$ no es uniformemente mayor que $Y$: mientras que $X(a)=2,$ $Y(a)=3$ es más grande. Sin embargo, $X$ logra dominar $Y$ porque hay diferentes subconjunto de $\Omega$ (es decir,$\{b,c,d\}$) en que $Y$ es claramente inferior a $X$.
La clave de la idea que vale la pena reflexionar es que las probabilidades de las $X$ $Y$ representado en la parte inferior de los gráficos (de las funciones de distribución) pueden provenir de diferentes subconjuntos de a $\Omega$. No es necesario, por ejemplo, que todas la probabilidad asociada con $F_X(2)$ (que sólo viene de $\{a\}$) corresponden al mismo conjunto asociado con $F_Y(2)$ (que viene de $\{b, c, d\}$). En este ejemplo los dos conjuntos no tienen nada en común!
Suma y resta de variables aleatorias
Las variables aleatorias se suman y se restan pointwise. Por ejemplo, la variable aleatoria $X-Y$ tiene el valor de $(X-Y)(a) = X(a) - Y(a) = 2 - 0 = 2$. Cálculos similares mantenga por el resto de $\Omega$. Cuando, por cualquier $\omega\in\Omega$, podemos agregar un valor negativo a $X(\omega)$, que deben cambiar el punto de $\omega$ a la izquierda en la gráfica de $X$, porque me han orientado el eje de valores a punto a la derecha.
La Wikipedia reclamación
El artículo de la Wikipedia sobre la dominancia estocástica se utiliza el término de "jugar", sin definición. Este parece ser un sinónimo de "variable aleatoria" (y la palabra "estado" parece referirse a cualquier elemento de $\Omega$). Utiliza dos formas de notación para las apuestas, al parecer, indistintamente: "$A$" y "$x_A$" se refieren a jugar y "$B$" y "$x_B$" a otro. Yo simplemente uso $X$ para el primero y el $Y$ para el último. Con este entendimiento, el artículo afirma que
Si y sólo si $X$ primer orden domina estocásticamente $Y$, existe alguna gamble $Z$ tal que $Y \overset {d}{=} (X+Z)$ donde $Z\le 0$ en todos los estados posibles (y estrictamente negativo en al menos un estado), ...
La equivalencia en la distribución, "$\overset{d}{=}$", simplemente significa que la distribución de las dos funciones son las mismas. Esto ocurre si y sólo si sus gráficas coinciden. Considerar cómo una coincidencia que podría hacerse pasar por el cambio de $X$$X+Z$: es decir, por mantener los valores de $X$ el mismo o haciendo que algunos de ellos más pequeños, queremos transformar la gráfica de $F_X$ en la gráfica de $F_Y$.
La figura muestra un contraejemplo a la demanda.
En el barrido de la construcción de la $F_{X+Z}$, por el tiempo que nos han arrastrado a la probabilidad por el valor de $x=2$, el valor de $X+Z$ $a$ ya han sido contabilizadas (desde $Z(a)$ puede ser no mayor $0$). Por lo tanto, no importa cuán $X$ es alterado por $Z$, el valor de $F_{X+Z}(2)$ debe $2/5$ o mayor. Por otra parte, en el gráfico de $F_{X+Z}$ debe exhibir un salto vertical de al menos $\mathbb{P}(\{a\})=2/5$ en el punto donde se $x = (X+Z)(a)$, debido a que todos la probabilidad de $\{a\}$ es arrastrado instantáneamente allí. Pero es obvio geométricamente que la gráfica de $F_X$ no se puede cambiar de esta manera, coincidiendo con la gráfica de $F_Y$, debido a que la última no tiene un salto vertical de este grande hasta $x=3$, que es demasiado tarde.
Cuando ni la gráfica tiene cualquier saltos discretos, es decir, cuando ambos $X$ $Y$ han continuo de las distribuciones, podemos sistemáticamente alterar los valores de $X$ a cambio de la gráfica de $F_X$ a la izquierda hasta que coincide con la gráfica de $F_Y$. (La prueba de ello implica la consideración de "infinitesimal" cantidades de probabilidad, o bien una medida de la teoría de la limitación de argumento.)