8 votos

Variación técnica frente a la señal real

Estoy probando la diferencia en un resultado continuo bajo tres condiciones diferentes.

En la condición A tomo una medida del resultado. Lo hago dos veces para la misma muestra. Los valores de ejemplo podrían ser 2,2, 2,1. Son réplicas "técnicas" que provienen de la misma fuente biológica

Hago lo mismo para cuatro réplicas "biológicas" para la condición A:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

También tengo las condiciones B, C y D, con dos réplicas "técnicas" en cada una de las cuatro réplicas "biológicas".

¿Cómo podría realizar una prueba de diferencias de medias (ANOVA) que tenga en cuenta de la mejor manera posible tanto la variación técnica como la biológica? No me gustaría ajustar un modelo contando cada medición como una observación separada, porque cada par proviene de la misma muestra biológica. Supongo que debe haber una forma mejor que simplemente promediar los pares.

Bonus: ¿cómo se hace esto en R?

Suponiendo que tengo datos que se parecen a esto:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

Probablemente no querría hacer algo así:

summary(lm(outcome~condition, data=data))

Gracias de antemano.

1voto

Ted Puntos 854

El problema es que tienes varias fuentes posibles de aleatoriedad. La aleatoriedad individual (el término de error normal en una regresión lineal); la variación entre tus dos mediciones en cada caso; y la variación de las unidades particulares que has muestreado. Creo que probablemente quieras algo como

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

Espero que eso ayude.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X