7 votos

Algunas preguntas sobre comparaciones de dos muestras.

Estoy aplicando algunos análisis estadísticos utilizando python scipy.estadísticas de la biblioteca para algunos conjuntos de datos que he tomado en parejas), se prueba si ambos vienen de la misma desconocido de distribución.

No tengo mucho de fondo en las estadísticas, así que me perdone por las siguientes preguntas. Yo estaba mirando la documentación y tengo algunas dudas.

  • scipy.estadísticas.mannwhitneyu: devuelve un "One-sided p-valor asumiendo una distribución asintótica normal" . ¿Por qué es asumiendo una normal distribución? Debe no esta la prueba de funcionar en cualquier distribución subyacente?
  • scipy.estadísticas.ttest_ind: Esta prueba asume que las poblaciones tienen las mismas variaciones. En mi caso puedo calcular la varianza de la muestra, por lo que una vez yo debería aplicar la prueba sólo si no se diferencian por un cierto umbral (¿cuál?)? Curiosamente, esta es sólo una prueba estadística rechazado sólo un pocos de mis hipótesis, mientras que la mayoría de los otros rechazado el 80% de ellos.
  • Como cuestión de hecho, quiero probar si la distribución de un conjunto de datos es significativamente mayor que la de todos los demás conjuntos de datos juntos. Debo usar una a una cara o a dos caras de la prueba aquí? Esto puede sonar tonto, pero en el caso de un solo lado de la prueba, ¿cómo puedo probar para una distribución siendo significativamente mayor que en contraposición a significativamente más pequeño? Yo coudln no encontrar nada en scipy documentación acerca de esto. El intercambio de los argumentos que da el mismo resultado.

7voto

Niall Puntos 51

Voy a responder a tus balas con balas de mi cuenta en el mismo orden:

  • Creo que la frase se refiere a los grandes de la muestra (asintótica) de la distribución de la estadística de prueba, no los datos. Como se puede ver aquí, la U de Mann-Whitney prueba estadística tiene un aproximado de la distribución normal cuando el tamaño de la muestra es grande.

  • Con el fin de asumir la igualdad de la varianza, se puede considerar hacer una especie de diagnóstico de verificación acerca de si las varianzas son iguales. Es una práctica común para operar en virtud de la igualdad de la varianza de la asunción, a menos que una prueba de hipótesis rechaza la hipótesis de que - test de Levene Prueba, que pone a prueba la hipótesis nula de que las varianzas son iguales - se utiliza comúnmente para esto y tiene la propiedad de que es robusto a la no-normalidad de los datos . Cuando las varianzas son realmente iguales, va en detrimento de la potencia estadística por no asumiendo igualdad de varianza, por lo que es bueno hacer esto cada vez que puede. Sin embargo, debe tener en cuenta que si usted tiene un pequeño tamaño de la muestra, usted puede tener un poco de poder para detectar la falta de homogeneidad de la varianza por lo que si la muestra variaciones son muy diferentes el uno del otro que usted debe considerar no asumiendo igualdad de varianza, incluso si no se puede rechazar la nula de Levene Prueba.

  • Si por "quiero probar si la distribución de un conjunto de datos es significativamente mayor" que significa que uno significa que es más grande que el otro, entonces esto sería una cara prueba. Si estás probando una hipótesis alternativa de la forma $\mu_1 > \mu_2$, entonces usted se verá en el área a la derecha de su observó estadística de prueba en lugar de a la izquierda, que es lo que lo distingue de un "menor que" uno de los lados de la prueba. Por supuesto, si la intersección de las funciones de las dos muestras y el interruptor de la hipótesis de un "menos de" hipótesis", obtendrá los mismos resultados, ya que todo es menos invierte. Si usted está haciendo una prueba de dos caras, intercambiando los roles de las dos muestras debe dar el mismo $p$-valor.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X