5 votos

Distribución de la probabilidad de muestreo-¿cuántas muestras?

Pregunta Simple.

Tengo un rv $X$ cuya media y varianza sé, pero estoy interesado en la verdadera distribución, $P(X \le a)$ que no lo sé. Así que recurrir al muestreo $X$. Hago esto $N$ tiempos y crear un aproximado pmf para $X$. Quiero saber que tan "bueno" que es esto. ¿Cómo cuantificar esto?

Bueno, más realista, estoy interesado en este valor específico $P(X \le k)$. Dicen que la verdadera respuesta a esto es $\alpha$ que no lo sé. Pero el uso de mi $N$ muestras que tener una respuesta a esta como $\beta$. Ahora, ¿cómo de cerca es $\alpha$ $\beta$probabilísticamente?

2voto

mark Puntos 232

El Teorema del Límite Central tiene algo que decir sobre tu última pregunta. Específicamente, la manera usual de estimar como $P\left(X \leq k \right)$ consiste en la utilización de la función de distribución empírica (ECDF) y la informática

$$F_n(k) = \sum_{i=1}^n \frac{1}{n} \mathbf{1} \left(X_i \leq k \right)$$

donde nos acaba de contar el número de observaciones $X_1, \ldots, X_n$ que se quedan cortos de $k$ y dividir por el número total de observaciones. Es decir, nuestro más intuitiva estimador para esta probabilidad es la muestra correspondiente proporción.

Resulta que este estimador tiene fantásticas propiedades estadísticas. Se puede demostrar que converge, como $n \to \infty$, $P\left(X\leq k \right)$ con una probabilidad de uno y que lo hace de manera uniforme para todos los valores de $k$. Desde $F_n(k)$ es también una suma de iid términos, uno puede además aplicar la CLT para hacer probabilístico declaraciones acerca de la distancia desde el número real. No es muy difícil demostrar que

$$F_n(k) \xrightarrow{D} \mathcal{N} \left( P(X\leq k), \frac{ P(X\leq k)\left(1-P(X\leq k\right)} {n} \right) $$

Utilizando las propiedades de la distribución Normal se puede hacer probabilístico declaraciones acerca de la cantidad de $|F_n(k)-P(X\leq k)|$ después de conectar $F_n(k)$ en la varianza de la distribución asintótica.

2voto

Lev Puntos 2212

Como se indicó en respuestas anteriores, la frequency$$\frac{1}{N}\sum_{i=1}^N \mathbb{I}_{(-\infty,x]}(X_i) \stackrel{\Delta}{=} \frac{1}{N} S_N$$is associated with a Binomial variate $S_N\sim\text{Bin empírica}(N,p) $ for which a conservative confidence interval can be constructed. There are many proposals for this construction. Including one by George Casella.

For instance, Jeffreys' confidence interval on $p$ with coverage $1-2\alpha$ está dada por

N=50;SN=13;alpha=.05
qbeta(alpha,.5+SN,.5+N-SN)
[1] 0.1268967
qbeta(1-alpha,.5+SN,.5+N-SN)
[1] 0.4364774

1voto

Zahava Kor Puntos 72

Si es sólo P(X≤k) que necesita para un determinado k, entonces se convierte en un relativamente simple problema. Se puede tratar el problema como el muestreo de una variable aleatoria binomial Y~ Bin(N,p) donde usted está interesado en la estimación de la probabilidad de éxito p (o lo que ustedes llaman α). Para cada valor muestreado x de la distribución de X, un éxito será x≤k y de la estimación de p (o α) será s/N, donde s es el número de éxitos (número de la muestra x, de los cuales se ≤k). No existe una respuesta definitiva a cómo cerrar la estimación es, es hasta usted para determinar. Usted puede construir un intervalo de confianza para p (con, digamos, de confianza 0.95) y ver si el intervalo es lo suficientemente estrecha como para usted. Por el contrario, puede decidir cuál es el margen de error para p que usted está permitiendo es (por ejemplo, +-0.02), y determinar si el nivel de confianza obtenido es bastante alta. Una tercera forma es determinar el margen de error y el nivel de confianza y resolver para el tamaño de la muestra N. me di cuenta de que el título de tu pregunta es acerca de la necesaria y el tamaño de la muestra - este no aparece en la pregunta misma. Para la determinación de N es necesario tener tanto un margen de error (E) y un nivel de confianza CL (que determina Z como el valor de la distribución Normal estándar con probabilidad (1-CL)/2 a la derecha) y, a continuación, N=0.25(Z/E)2 0.25 es conservador - suponiendo que usted no sabe nada acerca de p (o α).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X