50 votos

Si el test t y el ANOVA para dos grupos son equivalentes, ¿por qué no son equivalentes sus supuestos?

Estoy seguro de que tengo esto completamente envuelto alrededor de mi cabeza, pero no puedo entenderlo.

La prueba t compara dos distribuciones normales utilizando la distribución Z. Por eso hay una suposición de normalidad en los DATOS.

ANOVA es equivalente a la regresión lineal con variables ficticias, y usa sumas de cuadrados, como la OLS. Por eso hay una suposición de normalidad de los RESIDUOS.

Me ha llevado varios años, pero creo que finalmente he comprendido esos hechos básicos. Entonces, ¿por qué la prueba T es equivalente al ANOVA con dos grupos? ¿Cómo pueden ser equivalentes si ni siquiera asumen las mismas cosas sobre los datos?

32voto

Senseful Puntos 116

La prueba t con dos grupos supone que cada grupo se distribuye normalmente con la misma varianza (aunque las medias pueden diferir en la hipótesis alternativa). Esto equivale a una regresión con una variable ficticia, ya que la regresión permite que la media de cada grupo difiera pero no la varianza. Por lo tanto, los residuales (iguales a los datos con las medias de grupo restadas) tienen la misma distribución, es decir, normalmente se distribuyen con media cero.

Una prueba t con variaciones desiguales no es equivalente a un ANOVA unidireccional.

21voto

Rob Wells Puntos 361

La prueba T es simplemente un caso especial de la prueba F, en la que sólo se comparan dos grupos. El resultado de cualquiera de ellos será exactamente el mismo en términos del valor p y también hay una relación simple entre las estadísticas F y t. F = t^2. Las dos pruebas son algebraicamente equivalentes y sus supuestos son los mismos.

De hecho, estas equivalencias se extienden a toda la clase de ANOVAs, pruebas t y modelos de regresión lineal. La prueba t es un caso especial de ANOVA. El ANOVA es un caso especial de regresión. Todos estos procedimientos están subsumidos en el Modelo Lineal General y comparten los mismos supuestos.

  1. Independencia de las observaciones.
  2. Normalidad de los residuos = normalidad en cada grupo en el caso especial.
  3. Iguales de las desviaciones de los residuos = iguales desviaciones entre los grupos en el caso especial.

Se podría pensar que es la normalidad en los datos, pero se está comprobando la normalidad en cada grupo, lo que en realidad es lo mismo que comprobar la normalidad en los residuos cuando el único predictor en el modelo es un indicador de grupo. De la misma manera con varianzas iguales.

Como un aparte, R no tiene rutinas separadas para el ANOVA. Las funciones anova en R son sólo envoltorios de la función lm() - lo mismo que se utiliza para ajustar los modelos de regresión lineal - empaquetados de forma un poco diferente para proporcionar lo que se encuentra típicamente en un resumen de ANOVA en lugar de un resumen de regresión.

17voto

Anthony Cramp Puntos 126

Estoy totalmente de acuerdo con la respuesta de Rob, pero déjame decirlo de otra manera (usando wikipedia):

Supuestos ANOVA :

  • Independencia de los casos - esta es una suposición del modelo que simplifica el análisis estadístico.
  • Normalidad - la distribución de los residuos es normal.
  • La igualdad (o "homogeneidad") de las variaciones, llamada homosexualidad

Supuestos t-prueba :

  • Cada una de las dos poblaciones que se comparan debe seguir una distribución normal...
  • ... las dos poblaciones que se comparan deben tener la misma varianza ...
  • Los datos utilizados para llevar a cabo la prueba deben ser muestreados independientemente de las dos poblaciones que se comparan.

Por lo tanto, yo refutaría la pregunta, ya que obviamente tienen los mismos supuestos (aunque en un orden diferente :-) ).

5voto

Carl Russmann Puntos 1560

Un punto obvio que todos han pasado por alto: Con el ANOVA estás probando el nulo que la media es idéntica sin importar los valores de tus variables explicativas. Con una prueba T también puedes probar el caso unilateral, que la media es específicamente mayor dado un valor de tu variable explicativa que dado el otro.

4voto

syed Puntos 9

Preferiré usar el test t para comparar dos grupos y usaré el ANOVA para más de 2 grupos, debido a razones. La razón importante es la suposición de variaciones iguales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X