20 votos

Hoja de trucos Sopa de letras ANOVA y equivalentes de regresión

¿Puedo obtener ayuda para completar este intento tentativo (en curso) de orientarme sobre los equivalentes de ANOVA y REGRESIÓN? He estado intentando conciliar los conceptos, la nomenclatura y la sintaxis de estas dos metodologías. Hay muchos posts en este sitio sobre sus puntos en común, por ejemplo este o este pero no está de más disponer de un mapa rápido que diga "ya estás aquí" para empezar.

Tengo previsto actualizar este post y espero recibir ayuda para corregir errores.

ANOVA unidireccional:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

ANOVA de dos vías:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANOVA factorial de dos vías:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

ANOVA CON FACTORES (o SUJETOS): ( código aquí )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( código aquí )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

DISEÑO ANIDADO: ( código aquí )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

SITIOS ÚTILES:

  1. RExRepos
  2. Proyecto Personalidad
  3. Quick-R
  4. R-Bloggers
  5. Análisis anidado y Split-Plot de M. Crawley
  6. Modelos con múltiples efectos aleatorios
  7. Modelos de parcelas divididas
  8. El libro R de M. Crawley
  9. Dentro de los grupos y medidas repetidas
  10. Repetir medidas en R
  11. GLMM FAQ

2voto

Isabella Ghement Puntos 9964

Bonita lista, Antoni. Aquí hay algunas sugerencias menores:

ANOVA unidireccional: IV es un FACTOR con 3 o más niveles. También puede añadir un Ejemplo de datos: mtcars a esta entrada. (Del mismo modo, podría añadir declaraciones *Datos de ejemplo" a todas sus entradas, para dejar más claro qué conjuntos de datos está utilizando).

Anova de dos vías: ¿Por qué no utilizar IV1 e IV2 e indicar que las dos variables independientes deben ser factores con al menos dos niveles cada uno? La forma en que está planteado actualmente sugiere que un anova de dos vías podría incluir más de 2 variables independientes (o factores), lo que no tiene sentido.

Para el Anova bidireccional, yo diferenciaría entre estos dos subcasos: 1. 1. Anova de dos vías con efectos principales para IV1 e IV2 y 2. Anova de dos vías con una interacción entre IV1 e IV2. Anova de dos vías con una interacción entre IV1 e IV2. Este segundo punto es al que se refieren dos como anova factorial de dos vías). Una forma mejor de describir estos dos subcasos sería: 1. El efecto de IV1 en VD es independiente del efecto de IV2 y 2. El efecto de IV1 en VD es independiente del efecto de IV2. El efecto de IV1 en VD depende de IV2. También podría dejar más claro que son las variables independientes IV1 e IV2 las que se codifican como ficticias en el marco de la regresión.

En cuanto al ANCOVA, podría aclarar que sólo está considerando el ANCOVA unidireccional en su ejemplo actual. Para completar, podría añadir un ejemplo de ANCOVA de dos vías sin interacciones entre IV1 e IV2, y otro con interacción entre estas dos variables.

Para todo lo anterior, también podría añadir un elemento llamado Propósito que describe cuándo son útiles estos análisis. Por ejemplo:

Propósito (del anova unidireccional): Investigar si los valores medios de la VD son diferentes entre los niveles de la IV.

Para el MANOVA, ¿puede aclarar que se necesitarían (a) dos o más VD y (2) uno o más IV que sean factores? ¿Supongo que se puede diferenciar entre MANOVA unidireccional (con 1 factor) y MANOVA bidireccional? Lo mismo para MANCOVA.

El ANOVA DENTRO DE LOS FACTORES también se conoce como ANOVA DE MEDIDAS REPETIDAS, así que quizá pueda añadir esta terminología a su lista para quienes estén familiarizados con ella. También sería útil aclarar que el modelado de efectos mixtos proporciona una forma alternativa de modelar los datos de medidas repetidas. De lo contrario, los lectores podrían no apreciar la diferencia entre ambos enfoques.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X