Versión corta
Hay una diferencia por el tratamiento del tiempo y de este conjunto de datos?
O si la diferencia estamos tratando de demostrar es importante, ¿cuál es el mejor método que tenemos para las burlas de esto?
Versión larga
Ok, lo siento si es un poco biología 101 pero este parece ser un caso extremo en el que los datos y el modelo de necesidad de línea en el camino correcto con el fin de extraer algunas conclusiones.
Parece un problema común... Sería bueno para demostrar una intuición en lugar de repetir este experimento con muestras de mayor tamaño.
Digamos que tengo este gráfico, que muestra la media +- std. error:
Ahora parece que hay una diferencia aquí. Esto puede ser justificado (evitando enfoques Bayesianos)?
El simpleminded del hombre enfoque sería tomar el Día 4 y aplicar una prueba t-test (como de costumbre: 2 caras, no apareados, la desigualdad de la varianza), pero esto no funciona en este caso. Parece que la varianza es demasiado alto, ya que sólo había 3x mediciones por punto de tiempo (err.. sobre todo mi diseño, p = 0,22).
Editar En la reflexión de la siguiente solución obvia sería ANOVA en una regresión lineal. Pasó por alto esta sobre el primer proyecto. Esto también no parece ser el enfoque de derechos como el habitual modelo lineal es la alteración de heterocedasticidad (exagerada de la varianza a lo largo del tiempo). Final De Edición
Supongo que hay una forma de incluir todos los datos que puedan caber en un simple (1-2 parámetro) el modelo de crecimiento a través del tiempo por la variable predictora, a continuación, compare estos modelos utilizando algunos formal de la prueba.
Este método debe ser justificable, pero accesibles a un número relativamente poco sofisticados de la audiencia.
He mirado en compareGrowthCurves
en statmod, leer acerca de grofit y trató de un lineal de efectos mixtos modelo adaptado a partir de esta pregunta en SÍ. Esta última es la más cercana a la factura, aunque en mi caso las mediciones no son del mismo sujeto a lo largo del tiempo así que no estoy seguro de efectos mixtos/modelos multinivel son las adecuadas.
Un enfoque sensato sería el modelo de la tasa de crecimiento por el tiempo como lineal y fija y tiene el efecto aleatorio ser Tx , a continuación, la prueba de significación, aunque tengo entendido que hay un poco de debate sobre los méritos de este enfoque.
(También este método especifica un modelo lineal que no parece ser la mejor manera de modelar una comparación del crecimiento, que en el caso de un predictor aún no ha golpeado un límite superior y en la otra aparece básicamente estática. Supongo que hay una generalizada modelo de efectos mixtos de aproximación a esta dificultad con la que sería más apropiado.)
Ahora el código:
df1 <- data.frame(Day = rep(rep(0:4, each=3), 2),
Tx = rep(c("Control", "BHB"), each=15),
y = c(rep(16e3, 3),
32e3, 56e3, 6e3,
36e3, 14e3, 24e3,
90e3, 22e3, 18e3,
246e3, 38e3, 82e3,
rep(16e3, 3),
16e3, 34e3, 16e3,
20e3, 20e3, 24e3,
4e3, 12e3, 16e3,
20e3, 5e3, 12e3))
### standard error
stdErr <- function(x) sqrt(var(x)) / sqrt(length(x))
library(plyr)
### summarise as mean and standard error to allow for plotting
df2 <- ddply(df1, c("Day", "Tx"), summarise,
m1 = mean(y),
se = stdErr(y) )
library(ggplot2)
### plot with position dodge
pd <- position_dodge(.1)
ggplot(df2, aes(x=Day, y=m1, color=Tx)) +
geom_errorbar(aes(ymin=m1-se, ymax=m1+se), width=.1, position=pd) +
geom_line(position=pd) +
geom_point(position=pd, size=3) +
ylab("No. cells / ml")
Algunas pruebas formales:
### t-test day 4
with(df1[df1$Day==4, ], t.test(y ~ Tx))
### anova
anova(lm(y ~ Tx + Day, df1))
### mixed effects model
library(nlme)
f1 <- lme(y ~ Day, random = ~1|Tx, data=df1[df1$Day!=0, ])
library(RLRsim)
exactRLRT(f1)
este último dando
simulated finite sample distribution of RLRT. (p-value based on 10000
simulated values)
data:
RLRT = 1.6722, p-value = 0.0465
Por que llego a la conclusión de que la probabilidad de este tipo de datos (o algo más extremo), dada la hipótesis nula de que no hay ninguna influencia del tratamiento sobre el cambio en el tiempo está cerca a la esquiva 0.05.
De nuevo, lo siento si esto parece un poco básico, pero me siento un caso como este puede ser usado para ilustrar la importancia de la modelización en evitar la innecesaria repetición experimental.