4 votos

Intervalos de confianza para proporciones: ¿por qué no se utiliza la corrección de Bessel para estimar la desviación típica?

Cuando se calculan intervalos de confianza para una población con desviación típica desconocida, se estima utilizando la desviación típica muestral S, que utiliza la corrección de Bessel para aproximarse más a la real .

Pero supongamos que la población X es una variable Bernoulli. Siendo ahora X una variable binaria, $ \sum_{i=1}^n (x_i - \bar x)^2 = n\bar x (1 - \bar x) $ (como podemos ver en una respuesta a este pregunta). Así pues, la fórmula de la desviación típica muestral sería $ S = \sqrt {\frac {n} {n-1} \bar x (1 - \bar x)}$ .

Pero en todos los recursos que he leído sobre intervalos de confianza para proporciones cuando se desconoce la proporción poblacional p, la desviación típica de la población se estima mediante $ \sqrt{\bar p (1-\bar p)} $ . Esta aproximación, sin embargo, no utiliza la corrección de Bessel. Si lo hiciera, se aproximaría por $ \sqrt{\frac {n} {n-1} \bar p (1-\bar p)} $ .

I comprender que $ \bar p (1-\bar p)$ es un estimador coherente de $p(1-p)$ pero no $\frac {n} {n-1} \bar p (1-\bar p)$ ser coherente y insesgado y, por tanto, ¿un mejor estimador?

1voto

Puede haber dos cuestiones subyacentes distintas:

  • para una variable aleatoria Bernoulli, $\bar{x}$ es un estimador insesgado de la proporción de población $p$ mientras que $\frac{n}{n-1}\bar{x}(1-\bar{x})$ sería un estimador insesgado de $p(1-p)$ . Por lo general, la proporción es el parámetro de interés y las demás propiedades de la distribución se basan en él.

  • hay un número sorprendentemente grande de formas diferentes de producir un intervalo de confianza para la proporción: Wikipedia enumera varios aunque hay más, como el intervalo Blyth-Still-Casella. El método del intervalo de confianza relacionado con la prueba de Wald se enseña ampliamente como algo parecido a $\bar{x}\pm 1.96 \sqrt{\frac{\bar{x}(1-\bar{x})}{n}}$ pero en general se considera menos satisfactorio que los demás métodos; sus resultados no son descabellados cuando $n$ es grande y $\bar{x}$ no cerca de $0$ o $1$ pero esos no son los casos interesantes. En los casos más interesantes, preocupaciones como la discreción de la distribución binomial y el hecho de que $p$ debe estar entre $0$ y $1$ son cuestiones más importantes que el sesgo de la estimación de la varianza, y otros métodos abordan algunas de estas preocupaciones

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X