16 votos

Intervalo de confianza y tamaño de la muestra probabilidades multinomiales

Soy un principiante absoluto en estadística. Por favor, disculpe cualquier suposición errónea o falta de información en mi pregunta. Tengo una pregunta relacionada con una distribución multinomial (ni siquiera estoy 100% seguro de esto) con la que espero que alguien pueda ayudarme. Si tomo una muestra (supongamos $n=400$ ) en una variable categórica que tiene más de dos resultados posibles (por ejemplo, azul, negro, verde, amarillo) y trazar las frecuencias para que pueda derivar las probabilidades. Por ejemplo negro 10% azul 25 verde 35% amarillo 30

¿Cómo podría calcular el intervalo de confianza del 95% para esas probabilidades? ¿Y cómo puedo determinar el tamaño de la muestra necesario para obtener un resultado exacto con un margen de +-3% para cada probabilidad? Por favor, indíqueme si la respuesta a la pregunta requiere alguna información adicional.

8voto

anis Puntos 23

Muchas gracias de nuevo por su ayuda. Abajo está la solución (espero que correcta) usando el "Método de Aproximación Normal" del Intervalo de Confianza Binomial:

enter image description here

4voto

Daniel Fabian Puntos 1344

Me gustaría añadir el método de Wilson mencionado por Michael M en un comentario.
De Wikipedia: Intervalo de confianza de proporción binomial - Wilson_score_interval .
Puedes obtener un intervalo de confianza del 95% utilizando lo siguiente:

$\frac{n_s + \frac{z^2}{2}}{n+z^2} \pm \frac{z}{n+z^2}\sqrt{\frac{n_s n_f}{n}+\frac{z^2}{4}}$

El término de la izquierda es el valor central y el término de la derecha da el valor que hay que sumar / restar para obtener los límites del intervalo.

$n_s$ es el número de muestras de esa categoría, $n_f$ el número de muestras que no pertenecen a esa categoría, $n$ el número total de muestras y $z$ es 1,96 si quieres un intervalo de confianza del 95%*.

Para recuentos altos da los mismos resultados que la aproximación normal, sin embargo ésta debería ser mejor para recuentos bajos o valores extremos.

Como ejemplo, tenía una categoría con 0 muestras y la aproximación normal devolvía una e.s. de 0, y por lo tanto un intervalo de confianza de 0-0 (ya que era seguro que tenía 0% de probabilidad, mientras que en realidad tenía 0 ocurrencia sólo debido a las pocas muestras).

$ $

* El método es en realidad para una distribución binomial y $n_s$ y $n_f$ son éxitos y fracasos en esa distribución. Sin embargo, creo que se puede utilizar razonablemente para una multinomial, aunque no tiene en cuenta el hecho de que las probabilidades estimadas deben sumar 1. La aproximación normal tampoco lo tiene en cuenta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X