Estoy probando la diferencia en un resultado continuo bajo tres condiciones diferentes.
En la condición A tomo una medida del resultado. Lo hago dos veces para la misma muestra. Los valores de ejemplo podrían ser 2,2, 2,1. Son réplicas "técnicas" que provienen de la misma fuente biológica
Hago lo mismo para cuatro réplicas "biológicas" para la condición A:
A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6
También tengo las condiciones B, C y D, con dos réplicas "técnicas" en cada una de las cuatro réplicas "biológicas".
¿Cómo podría realizar una prueba de diferencias de medias (ANOVA) que tenga en cuenta de la mejor manera posible tanto la variación técnica como la biológica? No me gustaría ajustar un modelo contando cada medición como una observación separada, porque cada par proviene de la misma muestra biológica. Supongo que debe haber una forma mejor que simplemente promediar los pares.
Bonus: ¿cómo se hace esto en R?
Suponiendo que tengo datos que se parecen a esto:
> data
condition sample measurement outcome
1 A 1 1 2.2
2 A 1 2 2.1
3 A 2 1 2.0
4 A 2 2 2.1
5 A 3 1 1.9
6 A 3 2 1.8
7 A 4 1 1.5
8 A 4 2 1.6
9 B 1 1 1.7
10 B 1 2 1.6
11 B 2 1 1.5
12 B 2 2 1.6
13 B 3 1 1.4
14 B 3 2 1.3
15 B 4 1 1.0
16 B 4 2 1.1
17 C 1 1 2.4
18 C 1 2 2.3
19 C 2 1 2.2
20 C 2 2 2.3
21 C 3 1 2.1
22 C 3 2 2.0
23 C 4 1 1.7
24 C 4 2 1.8
Probablemente no querría hacer algo así:
summary(lm(outcome~condition, data=data))
Gracias de antemano.