Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

8 votos

La probabilidad de que una distribución binomial se desvíe de su media en una desviación estándar

Deje X ser una variable aleatoria que sigue la Distribución Binomial BIN(n,p), donde n es un entero positivo, mientras que p(0,1). Su media es np, y la desviación estándar es np(1p). De Chebyshev de la desigualdad de los rendimientos que Pr que es trivial. Hoeffding la desigualdad no parece útil para mejorar el obligado si se aplica de una manera directa.

Preguntas:

  1. Cuando p=1/2, es posible demostrar que para todos los n\ge 1 que \Pr\left(|X-np| > \sqrt{np(1-p)}\right) \le \frac{1}{2}?

  2. ¿Qué podemos decir de un general p\in(0,1)?

Observaciones:

  1. He encontrado una respuesta positiva a la Pregunta 1, que se presentan a continuación; esencialmente la misma que @Mau314 del comentario). Sin embargo, no es completamente satisfactorio, ya que tenemos que verificar la desigualdad para los pequeños de n (en la mayoría de los 25) numéricamente. Estoy en busca de una respuesta que es completamente analítico.

  2. Estoy enseñanza básica de la teoría de la probabilidad y estas preguntas se me ocurre cuando pienso en el Teorema del Límite Central. Cuando n\rightarrow \infty, asintóticamente tenemos \Pr\left(|X-np| > \sqrt{np(1-p)}\right) \sim \Pr(|Y| > 1) < \frac{1}{2}, donde Y es una variable aleatoria que sigue la Distribución Normal Estándar. Por lo tanto, planteo las preguntas por curiosidad.

  3. Tenga en cuenta que mi interés principal es el no-asintótica comportamiento de la probabilidad debido a la asintótica caso se caracteriza por la CLT.

  4. Uno puede atacar el problema directamente en la estimación de la función de distribución acumulativa de Distribuciones Binomiales. Para este fin, los límites de los Coeficientes Binomiales son probablemente necesario. Los resultados de este tipo se pueden encontrar en, por ejemplo, [Das], [Stanica], [Spencer, Capítulo 5], y la Wikipedia. Tenga en cuenta que no asintótica estimaciones son necesarios.

Gracias.

1voto

Will Puntos 21

Aquí está una respuesta positiva a la Pregunta 1. Sin embargo, es que no es completamente satisfactoria , porque tenemos que comprobar la desigualdad para las pequeñas n (en la mayoría de las 25) numéricamente. Estoy en busca de una respuesta que es completamente analítico.

Como @Mau314 señala en su comentario, un enfoque natural es examinar el error en la CLT, un clásico resultado de la Baya-Esseen teorema. Ver también la pregunta de"Berry-Esseen obligado para la distribución binomial". Según la Baya-Esseen teorema, \sup_{x\in\mathbb{R}}|F(x) - \Phi(x)| \le \frac{C[p^2+(1-p)^2]}{\sqrt{np(1-p)}}, donde F es la función de distribución acumulativa de (X-np)/\sqrt{np(1-p)} mientras \Phi es la de la Distribución Normal Estándar, y C es una constante. Se sabe que C<0.5 (ver [Shevtsova]), el cual contiene de una gran clase de distrbutions además de la Binomial. [Nagaev y Chebotarev, Teorema 2] demuestra C\le0.4215 para \text{BIN}(n,1/2). De acuerdo a tales límites, \Pr\left(|X-np| > \sqrt{np(1-p)}\right) \le \Pr(|Y|>1) + \frac{2C[p^2+(1-p)^2]}{\sqrt{np(1-p)}} < \frac{1}{3} + \frac{2C[p^2+(1-p)^2]}{\sqrt{np(1-p)}}. Así \Pr\left(|X-np| > \sqrt{np(1-p)}\right) < \frac{1}{2} para n \ge \frac{144 C^2[p^2+(1-p)^2]^2}{p(1-p)}. Cuando p=1/2, nos encontramos con que n\ge 26 es suficiente para guaruantee deseada de la desigualdad. De hecho, n\ge 22 es suficiente con un poco más de atención. Uno puede comprobar numberically que el de la desigualdad (por p=1/2) tiene por n\le 25 así. Por lo tanto la respuesta a la Pregunta 1 es positivo.

Como alternativa, se puede utilizar [Hipp y Mattner, Corolario 1.5], que dice que \left|P\left(X< \frac{n-\sqrt{n}}{2}\right)-\Phi(1)\right| \le \frac{1}{\sqrt{2\pi n}}. Por lo tanto \Pr\left(\left|X- \frac{n}{2}\right| > \frac{\sqrt{n}}{2}\right)\le \Pr(|Y|>1) + \sqrt{\frac{2}{\pi n}}. Esto se justificaría la deseada de la desigualdad de la n\ge 23. Los casos con 1\le n \le 22 se puede comprobar numéricamente.

0voto

user117529 Puntos 323

Este es demasiado largo para un comentario, pero no es una respuesta completa.

La motivación De de Moivre la derivación de su famoso Teorema del Límite Central para variables aleatorias de Bernoulli, también derivado de un local teorema del límite así:

(de Moivre) Denotan P_n(k) = \binom{n}{k}p^k(1-p)^{n-k}. Entonces \begin{align*} \sup_{x: |x| \le \psi(n)} \left|\frac{P_n(np + x \sqrt{npq})}{\frac{1}{\sqrt{2\pi npq}}e^{-x^2/2}} - 1\right| \rightarrow 0 \end{align*} para algunos la función de \psi(n) = o(npq)^{1/6}.

Lo que falla de Berry-Esseen es el hecho de thatt él sup es asumida x \in \mathbb{R}, mientras que en realidad queremos es tomar más de |x| \le 1 (en la parametrización de de Moivre arriba). En la prueba de este teorema del límite, asymptotics se utilizan, y por lo tanto una gran cantidad de información que se pierde, incluyendo la forma exacta de \psi(n) y la tasa a la cual la expresión de arriba se va a 0. Si tratamos de reproducir esta prueba, pero tener en cuenta para mantener un seguimiento de todos los molestos términos y los ataron con las desigualdades en vez de grande, -O notación, entonces podríamos llegar a algún lugar.

Un parcial de viaje Utilizando la fórmula de Stirling, podemos expresar \begin{align*} P_n(k) = \frac{1}{\sqrt{2\pi\hat{p}\hat{q}}}\exp\left(-n D(\hat{p}\|p)\right) \mathcal{E}(n, k, n-k) \end{align*} donde \begin{align*} \hat{p} &= \frac{k}{n}, \quad \hat{q} = 1 - \hat{p}, \\ D(a\|b) &= a \log\frac{a}{b} + (1-a)\log \frac{1-a}{1-b} \ge 2(a - b)^2, \\ \mathcal{E}(n,k,n-k) &= \frac{1 + \frac{1}{12n} + \frac{1}{288n^2} - \cdots}{(1 + \frac{1}{12k} + \frac{1}{288k^2} - \cdots)(1 + \frac{1}{12(n-k)} + \frac{1}{288(n-k)^2} - \cdots)} \le \exp\left(\frac{1}{12n}\right) \end{align*} Por lo tanto, \begin{align*} P_n(k) \le \frac{1}{\sqrt{2\pi\hat{p}\hat{q}}}\exp\left(-2n (\hat{p} - p)^2\right) \exp\left(\frac{1}{12n}\right) \end{align*} Dejando k = np + x \sqrt{npq} para |x| \le 1, \begin{align*} P_n(np + x\sqrt{npq}) &\le \frac{1}{\sqrt{2\pi pq}}\exp\left(-2pq x^2 \right) \exp\left(\frac{1}{12n}\right) \frac{\sqrt{pq}}{\sqrt{\hat{p}\hat{q}}} \\ &\le \frac{1}{\sqrt{2\pi pq}}\exp\left(-2pq x^2 \right) \exp\left(\frac{1}{12n}\right) \frac{\sqrt{pq}}{\sqrt{(p - \sqrt{pq/n})(q - \sqrt{pq/n})}} \end{align*} Deje x_k = -1 + 2k/N para k = 0, \cdots, N y argumentando a través de la integración de Riemann, \begin{align*} \sum_{k=0}^{N} P_n(np + x_k\sqrt{npq})\cdot \frac{2}{N} &\le \sum_{k=0}^{N}\frac{1}{\sqrt{2\pi pq}}\exp\left(-2pq x_k^2 \right) \exp\left(\frac{1}{12n}\right) \frac{\sqrt{pq}}{\sqrt{(p - \sqrt{pq/n})(q - \sqrt{pq/n})}}\cdot \frac{2}{N} \\ &\color{red}{\approx} \exp\left(\frac{1}{12n}\right) \frac{\sqrt{pq}}{\sqrt{(p - \sqrt{pq/n})(q - \sqrt{pq/n})}} \int_{-1}^{1} \frac{1}{\sqrt{2\pi pq}}\exp\left(-2pq x^2 \right) dx \end{align*} Este último paso será, sin duda, necesita algún tipo de justificación y las desigualdades relacionadas con las sumas de Riemann y sus respectivas integrales. Espero que esto sea un buen comienzo para una analítica de respuesta; la nota que he enumerado como muchas de las desigualdades como sea posible, y mientras he simplificado un par, usted puede retenerlos a través de los pasos de obtener más nítida de los límites.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X