Estoy aplicando algunos análisis estadísticos utilizando python scipy.estadísticas de la biblioteca para algunos conjuntos de datos que he tomado en parejas), se prueba si ambos vienen de la misma desconocido de distribución.
No tengo mucho de fondo en las estadísticas, así que me perdone por las siguientes preguntas. Yo estaba mirando la documentación y tengo algunas dudas.
- scipy.estadísticas.mannwhitneyu: devuelve un "One-sided p-valor asumiendo una distribución asintótica normal" . ¿Por qué es asumiendo una normal distribución? Debe no esta la prueba de funcionar en cualquier distribución subyacente?
- scipy.estadísticas.ttest_ind: Esta prueba asume que las poblaciones tienen las mismas variaciones. En mi caso puedo calcular la varianza de la muestra, por lo que una vez yo debería aplicar la prueba sólo si no se diferencian por un cierto umbral (¿cuál?)? Curiosamente, esta es sólo una prueba estadística rechazado sólo un pocos de mis hipótesis, mientras que la mayoría de los otros rechazado el 80% de ellos.
- Como cuestión de hecho, quiero probar si la distribución de un conjunto de datos es significativamente mayor que la de todos los demás conjuntos de datos juntos. Debo usar una a una cara o a dos caras de la prueba aquí? Esto puede sonar tonto, pero en el caso de un solo lado de la prueba, ¿cómo puedo probar para una distribución siendo significativamente mayor que en contraposición a significativamente más pequeño? Yo coudln no encontrar nada en scipy documentación acerca de esto. El intercambio de los argumentos que da el mismo resultado.