4 votos

¿Esto es un teorema en estadística? ¿Si no, alguien puede explicarme por qué esto parece ser verdad?

A mí me parece que las siguientes es verdadera:

Si $c$ es una variable aleatoria con probabilidad de $p(c)$ y la probabilidad acumulada $P(c)$, entonces la probabilidad de a $P(c)$ es constante.

He tomado $N$ valores aleatorios consistente con una función de probabilidad (en mi caso de prueba de que fue un simple gaussiano $p(x) = \frac{2}{\sqrt{\pi}}Exp(-x^2)$) para que el acumulado de PDF es $P(x) = Erf(x)$. Cuando me cree la $N$ variables aleatorias, yo graficar el histograma y volver a la gaussiana que me permite saber que el $p(x)$ es correcta. Entonces, para cada valor de $c$ que he creado, me evaluar $P(c)$ y, a continuación, trazar el histograma de $P(c)$, lo que parece ser constante (~$1/N$). Más puntos que creo, más cerca se convierte en un perfectamente (menos ruidoso) línea horizontal y de las desviaciones de la verdad $p(c)$, que se aleja de una línea recta.

He incluido el matlab código de abajo. Tenga en cuenta que como dejamos $N$ se hacen más grandes (en la línea 1), la gráfica resultante en la figura 2 se convierte en más y más perfectamente recta. Si nosotros, sin embargo, el cambio de la línea 13 y permitir rv = 0.5*rand(), y el resultado es $p(c)$ se desvía de la verdadera gaussiano y que la desviación se refleja en la figura 2.

 1 N = 50000;
 2
 3 cs = zeros(N,1);
 4 maxPx = 0.0;
 5 for i = 1:N
 6   while(cs(i) == 0)
 7     x = 10*(2*rand()-1);
 8     Px = (2/sqrt(pi))*exp(-x^2);
 9     if(Px > maxPx)
10       maxPx = Px;
11     end
12     rv = (2/sqrt(pi))*rand();
13 %    rv = 0.5*rand();
14     if(rv < Px)
15       cs(i) = x;
16     else
17     end
18   end
19 end
20
21 figure(1);
22 [ns, xs] = hist(cs, 100);
23 
24 plot(xs, ns, 'k.');
25 axis([min(xs) max(xs) 0 max(ns)]);
26
27 Ps = zeros(N,1);
28 for i = 1:N
29   x = cs(i);
30   Ps(i) = erf(x);
31 end
32
33 figure(2);
34 [ns, xs] = hist(Ps, 100);
35 plot(xs, ns, 'k.');
36 axis([min(xs) max(xs) 0 max(ns)]);

EDIT: incluye imágenes (1) tomando N = 50,000

La distribución de gauss es: enter image description here

para que los relacionados con la probabilidad es: enter image description here

(2) Permitir que N crezca 5.000.000 tenemos

La distribución de gauss: enter image description here

y el relacionado con la probabilidad: enter image description here

(3) Finalmente, cuando se cambia la función original de la distribución de gauss

tenemos para la distribución: enter image description here

y la probabilidad: enter image description here

1voto

Nikolai Prokoschenko Puntos 2507

El error de la función no es una función de distribución acumulativa: puede tomar valores negativos, mientras que la probabilidad de que no se puede. Para corregir esto simplemente requiere un ajuste lineal a los datos.

Para una suficientemente bien educados variable aleatoria (por ejemplo, uno de ellos con una estrictamente creciente continua de la función de distribución acumulativa), su declaración es verdadera.

Si la función de distribución acumulativa de la variable aleatoria $X$ $F(x) = \Pr (X \le x)$ y tiene una inversa $G(y) = F^{-1}(y)$$0 \lt y \lt 1$, a continuación, defina una nueva variable aleatoria $Y=F(X)$ y la nota $G(Y)=X$.

Consideremos ahora la función de distribución acumulativa de $Y$. Lo que usted está buscando en es $\Pr(Y\le y) = \Pr(F(X)\le y)$ que es igual a $\Pr(X \le G(y))$. Esta tiene una función de distribución acumulativa $F(G(y))$$0 \lt y \lt 1$.

$F(G(y)) = F(F^{-1}(y)) = y$, que es la función de distribución acumulativa de una norma uniforme de la variable aleatoria. Por lo $Y = F(X)$ es distribuido uniformemente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X