24 votos

Lo que hace que la media de algunas distribuciones indefinido?

Muchos archivos Pdf rango de menos a infinito positivo, sin embargo, algunos medios se definen y algunos no lo son. ¿Qué rasgo común hace algunos computable?

27voto

AdamSane Puntos 1825

La media de una distribución se define en términos de una integral (voy a escribir como si de una distribución continua - como una integral de Riemann, dicen - pero el problema se aplica en general; se puede proceder a Stieltjes o integración de Lebesgue para lidiar con estos correctamente y todos a la vez):

$$E(X) = \int_{-\infty}^\infty x f(x)\, dx$$

Pero ¿qué significa eso? Es una abreviación de

$$\stackrel{\lim}{_{a\to\infty,b\to\infty}} \int_{-a}^b x\, f(x)\, dx$$

o

$$\stackrel{\lim}{_{a\to\infty}} \int_{-a}^0 x f(x)\, dx \, +\, \stackrel{\lim}{_{b\to\infty}} \int_{0}^b x f(x)\, dx$$

(a pesar de que se podía romper en cualquier lugar, no sólo en 0)

El problema viene cuando los límites de las integrales no son finitos.

Así, por ejemplo, considerar el nivel de Cauchy densidad, la cual es proporcional a $\frac{1}{1+x^2}$ ... tenga en cuenta que

$$\stackrel{\lim}{_{b\to\infty}} \int_{0}^b \frac{x}{1+x^2}\, dx$$

deje $u=1+x^2$, lo $du=2x\,dx$

$$=\,\stackrel{\lim}{_{b\to\infty}}\frac12 \int_{1}^{1+b^2} \frac{1}{u}\, du$$

$$=\,\stackrel{\lim}{_{b\to\infty}} \frac{_1}{^2}\ln(u)\Bigg |_{1}^{1+b^2} $$

$$=\,\stackrel{\lim}{_{b\to\infty}} \frac{_1}{^2}\ln(1+b^2)$$

que no es finito. El límite en la mitad inferior no es también finito; la expectativa es lo indefinido.

O si hemos tenido como variable aleatoria el valor absoluto de un estándar de Cauchy, toda su expectativa sería proporcional a ese límite que acabamos de ver (es decir,$\stackrel{\lim}{_{b\to\infty}} \frac12\ln(1+b^2)$).

Por otro lado, algunas otras densidades seguir "hasta el infinito", pero su integral tiene un límite.

11voto

Colin Puntos 109

Las otras respuestas son buenas, pero no podría convencer a todos, especialmente a las personas que echar un vistazo a la distribución de Cauchy (con $x_0 = 0$) y dicen que todavía es intuitivamente obvio que la media debe ser cero.

La razón por la respuesta intuitiva no es correcto desde la perspectiva matemática es debido a la Riemann reordenamiento del teorema (video).

Efectivamente lo que está haciendo cuando usted está buscando en una de Cauchy y diciendo que la media "debe ser igual a cero" es que va a dividir abajo en el "centro" en cero, y luego afirman que los momentos de los dos tamaños de equilibrio. O en otras palabras, usted está implícitamente haciendo una infinita suma con "la mitad" de los términos positivos (los momentos en cada punto a la derecha) y "la mitad" de los términos negativos (los momentos en cada punto a la izquierda) y afirmando que las sumas a cero. (Para los más técnicos: $\int_{0}^\infty f(x_0+r)r\, dr - \int_{0}^{\infty} f(x_0-r)r\, dr = 0$)

La definición de la integral de reordenamiento del teorema dice que este tipo de infinita suma (uno con tanto positivo como negativo) sólo es consistente si las dos series de términos positivos y sólo en términos negativos) son cada convergente cuando se toma de forma independiente. Si ambos lados (positivos y negativos) son divergentes en su cuenta, entonces usted puede venir para arriba con una orden de la suma de los términos tales que la suma de cualquier número. (Vídeo de arriba, a partir de las 6:50)

Así que, sí, si haces la suma de una manera equilibrada de 0 a cabo, en los primeros momentos de la distribución de Cauchy cancelar. Sin embargo, el estándar (de) de la definición de la media de no exigir el cumplimiento de este fin de suma. Usted debe ser capaz de sumar los momentos en cualquier orden y tienen que ser igualmente válidos. Por lo tanto, la media de la distribución de Cauchy no está definido por la juiciosa elección de la forma en que la suma de los momentos, usted puede hacer que el "equilibrio" (o no) en prácticamente cualquier punto.

Así que para la media de una distribución definida, los dos momento integrales necesidad de ser cada uno de forma independiente convergente (finito) en torno a la propuesta de la media (que, cuando usted hace la matemáticas, en realidad es sólo otra manera de decir que el pleno de la integral de ($\int_{-\infty}^\infty f(x)x\, dx$) debe ser convergente). Si las colas son "gordos" lo suficiente como para hacer que el momento para un lado infinita, ya está hecho. No se puede encontrar el equilibrio con una infinita momento en el otro lado.


Debo mencionar que la "contra-intuitivo" el comportamiento de las cosas, como la distribución de Cauchy es enteramente debido a problemas a la hora de pensar en el infinito. Tome la distribución de Cauchy y cortar las colas - incluso arbitrariamente lejos, como en más/menos el número de xkcd - y (una vez re-normalizado) de repente algo que es bien portado y ha definido un decir. No las colas de grasa en-y-de-sí que son un problema, es cómo esas colas se comportan como enfoque infinito.

9voto

David Puntos 41

General Abrial y Glen_b había respuestas perfectas. Solo quiero añadir una pequeña demo para mostrar que la media de la distribución de Cauchy no existe / no converge.

En el siguiente experimento, se le ve, aunque se obtiene un gran ejemplo y calcluate empírica de la media de la muestra, los números son muy diferentes de experimento a experimento.

set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))

enter image description here

Se puede observar que tenemos $100$ experimentos, y en cada experimento, se muestra $1\times 10^5$ puntos de dos distribuciones, con un gran tamaño de muestra, el empírica significa que a través de diferentes experimentos deben estar bastante cerca de la verdadera media. Los resultados de la muestra distribución de Cauchy no tiene una convergencia de decir, pero la distribución normal tiene.

EDITAR:

Como @mark999 mencionado en el chat, se debe argumentar las dos distribuciones utilizadas en el experimento similar "varianza" (la razón por la que utilizo cita es debido a Cauchy distribución de la varianza también es indefinido.). Aquí está la justificación: PDF son similares.

Tenga en cuenta que, mirando el PDF de la distribución de Cauchy, pensaríamos que es $0$, pero a partir de los experimentos que podemos ver, no existe. Ese es el punto de la demostración.

curve(dnorm, -8,8)
curve(dcauchy, -8,8)

enter image description here

5voto

Dwight T Puntos 544

La distribución de Cauchy es una forma encubierta de una distribución fundamental, a saber, la distribución uniforme en un círculo. En las fórmulas, la probabilidad infinitesimal es $d\theta/2\pi$ donde $\theta$ es el ángulo de coordenadas. La probabilidad (o medida) de un arco $A\subset \mathbb S^1$$\mathtt{length}(A)/2\pi$. Esto es diferente de la distribución uniforme $U(-\pi,\pi)$, aunque las medidas son de hecho los mismos para los arcos que no contengan $\pi$. Por ejemplo, en el arco de $\pi-\varepsilon$ contra reloj para $-\pi+\varepsilon\ (=\pi+\varepsilon \mod 2\pi)$, la media de la distribución en el círculo es $\pi$. Pero la media de la distribución uniforme $U(-\pi,\pi)$ sobre el correspondiente de la unión de dos intervalos disjuntos, cada uno de longitud $\varepsilon/2\pi$, es cero.

Dado que la distribución en el círculo es rotacionalmente simétricas, no puede ser una media, la mediana o el modo en el círculo. Del mismo modo, los momentos de orden superior, tales como la varianza, no puede tener sentido. Esta distribución surge de forma natural en muchos contextos. Por ejemplo, mi proyecto actual consiste en imágenes de microscopio del tejido canceroso. Los numerosos objetos en la imagen no son simétricos y una "dirección" puede ser asignado a cada uno. La obvia hipótesis nula es que estas instrucciones están distribuidos de manera uniforme.

Para disimular la simplicidad, vamos a $\mathbb S^1$ ser el estándar de la unidad de círculo, y deje $p=(0,1)\in\mathbb S^1$. Definimos $x$ como una función de la $\theta$ por stereographical proyección del círculo de $p$ a de la $x$-eje. La fórmula es $x=\tan(\theta/2)$. La diferenciación, nos encontramos con $d\theta/2 = dx/(1+x^2)$. La probabilidad infinitesimal es, por tanto,$\frac{d\theta}{\pi(1+x^2)}$, la forma usual de la distribución de Cauchy, y "Hey, presto!", la simplicidad se convierte en un dolor de cabeza, que requieren tratamiento por las sutilezas de la integración de la teoría.

En $\mathbb S^1 \setminus \{p\}$, podemos pasar por alto la ausencia de $p$ (en otras palabras, restablecer $p\in\mathbb S^1$) de cualquier consideración, como la media o de mayor orden que momento, porque la probabilidad de $p$ (a su medida) es cero. Por lo tanto, la no existencia de los media y de los momentos de orden superior se traslada a la línea real. Sin embargo, ahora hay un punto en especial, a saber,$-p = (0,-1)$, que se asigna a $0\in\mathbb R$ por debajo de la proyección estereográfica y esto se convierte en la mediana y la moda de la distribución de Cauchy.

3voto

Sgnl Puntos 111

Por definición de Lebesgue-Stieltjes integral, la media existe si:

$$\int \vert x\vert dF(x)<\infty.$$

https://en.wikipedia.org/wiki/Moment_(matemáticas)#Significance_of_the_moments

https://en.wikipedia.org/wiki/Lebesgue_integration

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X