4 votos

Control de normalidad de la distribución.

No puedo resolver el problema de mi tarea.

Se realizaron dos experimentos. En la primera, había más de 400 pacientes, y en el segundo, 250. En estos experimentos, los efectos de los diferentes las drogas fueron evaluados. El peso promedio de las personas en los dos grupos se compararon mediante la prueba t-test. La prueba de normalidad para la primera el grupo dio un p-valor por debajo del umbral de significancia, y para el segundo por encima del umbral de significancia (pero el histograma se en forma de campana). La variación en los grupos diferían en más de un 30%. Es es posible decir que los experimentos se compararon de forma incorrecta?

Hay respuesta respuestas a elegir, sólo uno de ellos es el correcto:

  1. todo lo que es malo, la distribución no es normal, necesitamos una prueba de Wilcoxon
  2. todo lo que es malo, las muestras tienen diferentes varianza y tamaños, se puede utilizar la prueba t-test
  3. las muestras son lo suficientemente grandes como para que todo está bien
  4. todo está bien, p-valor de uno de los grupos es mayor que el umbral, de manera que el resultado del primer grupo podría ser aleatoria, entonces la distribución es normal

Personalmente, creo que la respuesta correcta es la segunda, porque la condición para la aplicación de la prueba t es la homogeneidad de la varianza, y en estos experimentos es muy diferente. Pero no estoy seguro de que esta es la respuesta correcta.

4voto

manku Puntos 111

La pregunta es muy mal construidas y contiene algunas fallas graves. El contexto de la pregunta puede ayudar. Mirando las "reglas" y "directrices" para dos pruebas de t de muestras que se han dado previamente a la pregunta puede ayudar a averiguar lo que el autor quiere decir.

Los principales defectos son como sigue:

  • "[T]él el segundo [P-valor es ] por encima del umbral de significancia (pero el histograma fue en forma de campana)." Estoy de acuerdo con @statsandr (+1) que esto parece contradictorio.

  • "La variación en los grupos diferían en más de un 30%." La forma más adecuada para juzgar si la muestra variaciones indican que la población de varianzas pueden ser desiguales, es buscar en su relación, no su diferencia.

  • No se dice nada acerca de la diferencia en la muestra de medios y no tienen ni idea de cómo se da una gran diferencia sería de importancia práctica. Así que, en contra de lo estándar somos nosotros para juzgar una "incorrecta" la comparación?

Además, no sabemos si las dos muestras de prueba de la t en la discusión es un "pooled" o un "Welch' de la prueba. Una prueba de Welch se debe tener el cuidado de una diferencia en las varianzas. El DF de un Welch prueba no puede ser inferior a $\min[(n_1 - 1),(n_2 - 1)] = 249,$ por lo que la t estadística debe ser casi normal.

Si una situación de la vida real, mediante una prueba t de Welch, que se describe aquí, mi conjetura es que todo está OK. Pero la exposición de la pregunta es tan nebuloso que mi bola de cristal no dice que la respuesta a su autor espera.

2voto

michael Puntos 12

@1. La importancia de la normalidad decsreases mientras que N aumenta. Ver aquí o aquí. "Con grandes tamaños de muestra lo suficientemente (> 30 o 40), la violación del supuesto de normalidad no debe causar grandes problemas. Esto implica que podemos utilizar paramétrico procedimientos, incluso cuando los datos no están normalmente distribuidos" (de primera fuente).

@2. Esto puede ser un problema ya que si los tamaños de muestra son desiguales, varianzas desiguales pueden influir en el Tipo 1 de la tasa de error de la prueba de t ya sea aumentando o disminuyendo el Tipo 1. Aún así, puede que desee ejecutar un test de Levene prueba o para ver cuánto varianes diferentes.

@3: A mi entender grandes tamaños de muestra no es garantía de que todo va a estar bien. Ok, estamos tristes de que con el aumento de tamaño de la muestra el supuesto de normalidad se vuelve menos influyente en 1. No estoy muy seguro sobre el mismo ser cierto para la desigualdad de la varianza.

@ 4. No entiendo esa frase. Y de hecho, me parece que esta frase confusa, demasiado "para el segundo por encima del umbral de significancia (pero el histograma fue en forma de campana)". ¿Por qué dice "pero"? Una prueba significativa de la normalidad podría indicar que los datos no normales, no de la otra manera. Al menos este es el caso de las pruebas conozco como el test de Shapiro-Wilk, donde "El contraste de hipótesis de este ensayo es que la población está normalmente distribuida. Así, por un lado, si el valor de p es menor que el elegido nivel alfa, entonces se rechaza la hipótesis nula y no hay evidencia de que los datos de prueba no están distribuidos normalmente." (fuente)

EDITAR

Gracias a @Glen_b, quien señaló que la cita en "@1" deben ser restringidos, porque "mientras que la prueba de t puede llegar a tener un buen aspecto normal nula distribución, en muchos casos, si n es suficientemente grande, su rendimiento bajo el null no es realmente lo que la atención a la gente más sobre -- el rendimiento bajo la alternativa -- y no puede no ser tan grande, si usted se preocupa acerca de rechazar la nula en los casos donde el efecto no es tan fácil de recoger." (cita de Glen_b)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X