1 votos

Varianza del intervalo de confianza entre un conjunto de grupos,

Un psiquiatra está interesado en encontrar un intervalo de confianza del 90% para los tics por hora que presentan los niños con síndrome de Tourette. Los datos siguientes muestran los tics en una hora observada para 13 niños con síndrome de Tourette seleccionados al azar, con cada valor de tics por hora separado por una coma.

  • Niño 1: 8 tics por hora
  • Niño 2: 9 tics por hora
  • Niño 3: 0 tics por hora
  • Niño 4: 5 tics por hora
  • Niño 5: 9 tics por hora
  • Niño 6: 1 tic por hora
  • Niño 7: 1 tic por hora
  • Niño 8: 2 tics por hora
  • Niño 9: 7 tics por hora
  • Niño 10: 3 tics por hora
  • Niño 11: 9 tics por hora
  • Niño de 12 años: 3 tics por hora
  • Niño de 13 años: 4 tics por hora

Partes que ya he resuelto:

  1. El intervalo de confianza se calculó con la distribución t.
  2. Con un 90% de confianza, la media poblacional del número de tics por hora que presentan los niños con síndrome de Tourette se sitúa entre 3,035733655917 y 6,348881728698 días.

La parte en la que necesito ayuda: Si se observan muchos grupos de 13 niños con síndrome de Tourette seleccionados al azar, de cada grupo se obtendrá un intervalo de confianza diferente. Aproximadamente el x por ciento de estos intervalos de confianza contendrán el verdadero número medio poblacional de tics por hora y aproximadamente el y por ciento no contendrán el verdadero número medio poblacional de tics por hora. Con esta información, ayúdame a encontrar los porcentajes.

1voto

BruceET Puntos 7117

Si cree que un intervalo de confianza (IC) del 90% se obtiene por un método razonable, de modo que realmente tiene un 90% de "probabilidad de cobertura" de la media $\mu,$ entonces se puede decir que el 90% de las muestras de tamaño $n=13$ de esta población producirán IC de este tipo que incluyan $\mu.$

Mi pregunta en su caso es si un intervalo de confianza t es el apropiado tipo de IC.

Si se considera que las 13 mediciones se distribuyen normalmente, entonces a intervalo de confianza del 90% t para el número medio de tics por hora es $(3.04, 6.34).$ [Se acostumbra a redondear los límites de un IC a uno o dos dígitos más significativos que para los datos; no veo sentido en mantener una docena de decimales. Además, 'días' debe ser un error tipográfico].

t.test(x, conf.lev=.9)$conf.int
[1] 3.035734 6.348882
attr(,"conf.level")
[1] 0.9

Sin embargo, los datos no parecen distribuidos normalmente, aunque son aproximadamente simétricos. Un diagrama de probabilidad normal de datos normales debe ser aproximadamente lineal, pero tal parcela para sus 13 observaciones parece claramente curvada:

x = c(8,9,0,5,9,1,1,2,7,3,9,3,4)
qqnorm(x);  qqline(x, col="green", lwd=2)

enter image description here

Así que probé con una confianza no paramétrica del 90 basado en una prueba de Wilcoxon de una muestra. Debido a los empates en el datos, el IC $(2.5, 6.5)$ es sólo aproximada.

Además, un simple cuantil no paramétrico bootstrap 90% CI es $(3.23, 6.15)$ como se muestra a continuación. El tamaño de la muestra $n = 13$ puede ser demasiado pequeño para que un IC del "95 cubra el 90% de la población real.

set.seed(411)
a.re = replicate(5000, mean(sample(x,13,rep=T)))
quantile(a.re, c(.05,.95))
      5%      95% 
3.230769 6.153846

0voto

user281070 Puntos 286

Dado que se trata de un intervalo de confianza del 90%, a la larga, si se hacen muchos de estos intervalos, alrededor del 90% de ellos pondrán entre paréntesis la media correcta y alrededor del 10% fallarán.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X