6 votos

¿Cuál es la distribución de probabilidad de $1-\text{mean}(|A-B|)$ donde $A$ y $B$ son independientes U(0,1)?

No estoy muy versado en estadística, así que no estoy seguro de si mi pregunta está redactada exactamente de forma correcta, pero básicamente este es el problema que estoy tratando de resolver: imagina que tienes dos matrices de igual tamaño de n. Cada matriz se llena con números aleatorios de 0 a 1. Las matrices se restan entre sí, y se toma el valor absoluto. A continuación se calcula el valor medio de esta matriz, y este valor se resta de 1. Este proceso se repite para T ensayos, y los valores se trazan con un histograma para visualizar la distribución. Me gustaría tener una ecuación que diera dicha distribución, así como la media y la desviación estándar de la misma. He buscado mucho en Internet para tratar de encontrar una respuesta sin éxito. A continuación encontrará un código de matlab que hace lo que estoy hablando para una matriz de tamaño 8 y 100.000 ensayos:

clc

clear all

n=8;

T=100000;

H=zeros(1,T);

for i=1:T
    A=rand(1,n);
    B=rand(1,n);
    H(i)=mean(1-abs(A-B));
end

histfit(H,100);

Minimum=min(H)
Maximum=max(H)
Mean=mean(H)
Standard_Deviation=std(H)

Se puede observar que la media se aproxima a 2/3 con el aumento de los ensayos, y que la desviación estándar disminuye con el aumento del tamaño de la matriz n. Para n=8 es de aproximadamente 8,33. Parece que es normal, pero no del todo.

Se agradece cualquier ayuda, gracias.

0 votos

min max mean y std deben estar en sus propias líneas

10voto

AdamSane Puntos 1825

$A-B$ tiene una distribución triangular simétrica en $(-1,1)$ . Tiene media 0 y varianza $\frac{1}{6}$ .

$|A-B|$ tiene un $\text{beta}(1,2)$ distribución. Tiene una media $\frac{1}{3}$ y la varianza $\frac{1}{18}$ .

La distribución de una suma de variables aleatorias beta se conoce para $n=2$ (ver 1 ).

Editar:

En realidad, esta beta en particular es tan sencilla que podemos hacer la integral, no sé por qué no lo he intentado antes. Dejemos que $Y_i=|A_i-B_i|$ . Podemos calcular la densidad de $Z=Y_1+Y_2$ y se puede encontrar la distribución de $1-\frac{1}{2}\sum_{i=1}^2 |A_i-B_i|$ de eso.

Por integración simple y directa (de la integral de convolución),

$f_Z(z) = \begin{cases} \frac{2}{3}z\,(z^2-6z+6) &\mbox{for } 0<z\leq 1 \\ \frac{2}{3}(2-z)^3 & \mbox{for } 1<z\leq 2\\ 0 &\mbox{elsewhere }. \end{cases}$

enter image description here

Entonces la densidad de $H_2=1-Z/2$ es sólo un reescalado lineal de esa densidad.

Esto se convierte rápidamente en algo difícil de manejar. Si lo he hecho bien, una suma de 4 $Y_i$ tendrá cuatro piezas, cada una de ellas formada por polinomios de 7º orden, y 8 tendría ocho piezas, cada una de ellas polinomios de 15º orden. Si tienes un buen sistema de álgebra computacional a mano, ciertamente podrías calcularlos, pero no creo que sea realmente informativo .]

--

Para los moderados $n$ No creo que incluso este caso relativamente simple no se conoce algebraicamente - pero usted podría hacer la convolución numéricamente, bastante simple.

Para los grandes $n$ puedes hacer uso del teorema del límite central. La media y la varianza de $1-\frac{1}{n}\sum_{i=1}^n |A_i-B_i|$ son sencillas: si no he cometido un error, son $\frac{2}{3}$ y $\frac{1}{18n}$ .

Aunque no es tan preciso para $n=8$ , por $n=20$ la aproximación normal es bastante buena:

enter image description here

\===

Editar:

¿A qué te refieres exactamente cuando dices que podrías hacer la convolución numéricamente? ¿Qué es exactamente lo que estaría convolucionando?

Dejemos que $Y_i=|A_i-B_i|$ Así que $H=1-\frac{1}{n}\sum_{i=1}^n Y_i$ .

Aparte de un reescalado lineal -- que es trivial -- se necesita la distribución de la suma de $Y_i$ .

Ahí es donde entra la convolución; la densidad de $W+Z$ es el convolución de sus pdfs .

Por supuesto, en la práctica, no se hace la integral de convolución. El enfoque estadístico habitual es utilizar MGFs o, más generalmente, funciones características, pero aparte de una cuestión de signo (de nuevo, trivial), una CF es sólo una transformada de Fourier (básicamente en el mismo sentido que las MGFs son esencialmente transformadas de Laplace).

Así que, numéricamente, podrías usar FFTs para encargarte de la convolución. De hecho, se procede de la siguiente manera (usaré el símbolo de una función característica, pero puedes pensar libremente en la transformada de Fourier):

$\phi(Y_1+Y_2+...+Y_n)= \phi(Y_1)\times \phi(Y_2)\times ...\times \phi(Y_n)$

$\hspace{2cm} = \phi(Y_1)^n$

Entonces simplemente convertimos de nuevo por el Transformación inversa .

En un programa en el que se opera numéricamente, el enfoque habitual es discretizar adecuadamente el pdf (en algunos trozos de potencia de 2 razonablemente grandes; en algunos casos $2^{8}$ a $2^{10}$ puede ser suficiente, en otros casos tal vez quiera $2^{16}$ o más), tomar la FFT, llevarla a la enésima potencia, transformar de nuevo. Si se manejan correctamente las constantes (que deberían ser manejadas automáticamente por la FFT inversa de todos modos, se tiene al final una aproximación discreta al pdf de la suma de las $n$ variables aleatorias iid.

En la práctica, estas operaciones pueden ser un poco tediosas para que salgan bien la primera vez, pero suelen ser bastante rápidas de ejecutar.

\===

1 : Pham-Gia, T. y Turkkan, N. (1994). Fiabilidad de un sistema de reserva con duración de componentes beta. IEEE Transactions on Reliability , 71-75.

0 votos

Estamos en la misma onda :)

0 votos

Oh, oye, no me había dado cuenta de tu respuesta. Muy bien. Sí, realmente parece que estamos pensando en la misma línea.

0 votos

Tú fuiste el primero :) (se cruzaron mientras los escribía)

10voto

wolfies Puntos 2399

Si $A$ y $B$ son uniformes e independientes, entonces $(A-B) \sim Triangular(-1,0,1)$ .

Entonces $Z = |A-B|$ tendrá pdf $f(z)$ :

 f = 2 (1 - z);   domain[f] = {z, 0, 1};

Entonces, la función característica (cf) de la media muestral de $Z$ es $\big(E\big[e^{\large i \frac{t}{n} z}\big] \big)^n$ :


(fuente: <a href="http://www.tri.org.au/se/cfofsamplemeanofz.png" rel="nofollow noreferrer">tri.org.au </a>)

donde estoy usando el Expect de la función mathStatica paquete para Mathematica para automatizar los rizos.

(i) La pdf EXACTA de la media muestral de Z

Aunque la cf no parece tener una forma manejable para la inversión simbólica, nosotros puede invertirlo numéricamente, dado cualquier valor arbitrario de $n$ para obtener la FDP de la media muestral de $Z$ . Esto se hace a continuación en el gráfico (véase la curva azul).

(ii) APROXIMACIÓN CLT de la media muestral de Z

Anteriormente derivamos el pdf de $Z$ , a saber $f(z)$ , donde $Z$ tiene media $E[Z]= \frac13$ y la varianza $Var(Z) = \frac{1}{18}$ .

Entonces, por el Teorema Central del Límite, la media muestral de $Z$ es asintóticamente normal:

$$\bar Z_n \overset{a}{\sim } N\big(E[Z], \frac{Var(Z)}{n}\big) = N\big(\frac13, \frac{1}{18 n}\big)$$

Comparar lo real con lo aproximado

Ahora podemos comparar la fácil aproximación normal asintótica con la pdf exacta, para cualquier valor dado de $n$ . El siguiente diagrama ilustra la:

  • solución exacta (derivada de la inversión de la cf), cuando $n = 10$ : CURVA AZUL
  • Aproximación normal (CLT), cuando $n=10$ : CURVA ROJA


(fuente: <a href="http://www.tri.org.au/se/pdfsamplemeanofz.png" rel="nofollow noreferrer">tri.org.au </a>)

Incluso en el caso de un tamaño razonablemente pequeño $n=10$ la aproximación Normal funciona bastante bien.

Todo lo que queda es la fácil transformación de $\bar Z_n$ a $1-\bar Z_n$ que sólo implica cambiar su media normal de $\frac13$ a $\frac23$ Y todo listo.

0 votos

Gracias por su respuesta. ¿Qué programa has utilizado para determinar numéricamente el pdf? ¿Sabes si esto es posible en MATLAB?

1 votos

Utilicé Mathematica para invertir numéricamente la cf, para obtener el pdf. Esto se hace por integración numérica. Para ver cómo se hace, véase la sección 2.4 D del capítulo 2 de Rose/Smith (2002) ... cuya descarga gratuita está disponible aquí: mathstatica.com/book/bookcontents.html Estoy seguro de que podrías utilizar las mismas técnicas en MATLAB.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X