En la prueba t de student para comparar las medias de dos muestras, ¿la distribución normal de cada muestra es prehipotética o no? Como sabemos, la prueba t se utiliza para comparar dos muestras pequeñas independientes con un tamaño inferior a 30 (en cada muestra). En las muestras pequeñas, la distribución estadística de la muestra no suele ser normal. Si la distribución normal es una prehipótesis en la prueba t, tenemos que transformar (por ejemplo, raíz cuadrada) los datos antes de la prueba t.
Respuesta
¿Demasiados anuncios?No es necesario que te transformes antes del examen. La investigación ha demostrado que la prueba t es bastante fiable respecto a las desviaciones de la normalidad. Además, es adecuada para tamaños de muestra pequeños de, por ejemplo, 4, 6, 8, etc. Lo único que no se desea es un valor atípico fuerte, ya que se utilizan promedios y d.s.. Por ejemplo, la media de los cuatro números 1,2,3 y 1000000 es un poco superior a 250000 = 1000006/4. Así que en la recta numérica, la media de 250000 se encuentra en algún lugar del espacio exterior a 1/4 de la distancia de 1000000, donde resulta que no hay datos.
Las pruebas no paramétricas de Mann-Whitney o de suma de rangos de Wilcoxon pueden proteger contra los efectos atípicos, ya que se basan en rangos. La idea general es que si hay un valor atípico y se utilizan rangos, la media de los rangos 1,2,3,4 para los cuatro valores 1,2,3,1000000 es 2,5=10/4 -- que no es precisamente lo que hace Mann-Whitney, pero es similar con evaluaciones para empates. La hipótesis alternativa para Mann-Whitney es también que las dos muestras proceden de distribuciones diferentes. Pero todavía se necesita algún tipo de tendencia central para las pruebas no paramétricas.
Para la prueba t, también hay que saber si las d.s. son iguales entre las dos muestras. Si no es así, puede realizar un ajuste de la f.d. ( $\nu=n_1 + n_2-2$ ), o utilizar una prueba Welch.
Otro punto importante es que las pruebas paramétricas y no paramétricas de 2 muestras para la igualdad de medias son para distribuciones unimodales de datos, no multimodales con varias jorobas o picos grandes en las distribuciones.
Mann-Whitney tampoco es exactamente lo mismo que la suma de rangos de Wilcoxon, ya que hay una ligera variación en el numerador de sus estadísticas de prueba.
Si nos fijamos en las probabilidades de cola para el $t$ -distribución (rango de $\nu$ ) y la normal estándar, verá que la normal estándar empieza a aproximarse bastante a $t$ cerca de tamaños de muestra de $n \sim 120$ . Así que yo utilizaría una prueba Z para muestras de tamaño superior a $n=120$ y llamarlo large sample test
y decir simplemente $t$ es para muestras pequeñas.
Desde el punto de vista informático, me gusta utilizar las pruebas Z para muestras grandes, ya que calcular las probabilidades de cola para la distribución t es muy costoso en comparación con las probabilidades de cola de las puntuaciones Z.