6 votos

¿Cómo puedo calcular la regresión de varios conjuntos de datos longitudinales (por lo tanto, con el error de auto-correlacionadas)?

Mi proyecto actual es un poco complicado, pero voy a explicar por analogía (que espero que facilita la respuesta):

Tengo 3 sustancias, dicen que el agua, aceite de motor, y el etanol. Para cada sustancia, tengo 5 muestras en un vaso de precipitados (un total de 15 vasos de precipitados). Yo el calor, los vasos de precipitados sobre una placa caliente hasta 70 grados Centígrados, y durante la siguiente hora, puedo medir la temperatura del fluido en cada vaso de precipitados en intervalos de 5 minutos.

De newton de enfriamiento me proporciona una buena predicción acerca de estos datos de temperatura, es decir, que la temperatura del fluido en cada taza debe seguir una distribución exponencial: y = a + e^(-kt) donde a es la temperatura de la habitación.

Quiero calcular el valor de k para cada sustancia y probar la hipótesis de que k1 > k2 > k3 (1, 2, 3 correspondientes a mis tres sustancias). El método natural de la estimación de k parece ser el cálculo de una regresión no lineal en cada sustancia de datos, o posiblemente de registro-la transformación de todos los datos y, a continuación, sólo el cálculo de una regresión lineal simple. Sin embargo, hay problemas.

Algunas preguntas:

  1. Dada la evidente autocorrelación en los datos longitudinales (confirmado por mi (P)ACF parcelas de curso), tengo que calcular un AR término y filtrado de datos antes de calcular la regresión?
  2. Suponiendo que yo computar este autorregresión plazo, ¿cómo puedo calcular por cinco conjuntos independientes de datos (los cinco vasos de precipitados de una sustancia)? Yo podría promedio de los cinco vasos de precipitados juntos y, a continuación, calcular la regresión, pero esta tornillos mi AR plazo (suponiendo que necesito uno) y también se produce fuera de mi estimación de la real dentro-vaso de precipitado de la varianza del modelo.
  3. Lo completamente equivocada suposición(s) he trabajado aquí...?

3voto

pirho Puntos 1387

Como tenemos fuertes razones para creer que la refrigeración se siga el $y(t) = a + e^{-kt}$ función para cada vaso de precipitados en primer lugar, comprobar si este modelo se ajusta bien los datos de hecho.

Si lo hace que no me molestaría con el análisis de la autocorrelación en absoluto, sino que se centran en la estimación de $k_1$, $k_2$ y $k_3$, y la prueba de la hipótesis acerca de ellos.

Para estimar $k_1$, $k_2$ y $k_3$ usted necesita un modelo no lineal. Su idea de la transformación de registro seguido por modelos lineales es mejor cuando el error (diferencia entre la medida de la $y$ temperatura y el predicho por la fórmula) es proporcional a la temperatura. Sin embargo, sospecho que el error se debe principalmente a la medición de la temperatura y por lo tanto una distribución normal con la misma varianza para cualquier temperatura (usted necesita para comprobar esto). Si es así, un modelo no lineal, sería más apropiado.

Un modelo de uso de la función anterior va a dar estimaciones para los parámetros de la refrigeración de un solo vaso, $a$$k$. Sin embargo, podemos suponer que $a$ debe ser el mismo para cada vaso de precipitados, $k$s debe ser similar para la misma sustancia, y que la desviación estándar ($\sigma$) es el mismo en todas las mediciones de temperatura. Estos pueden ser expresadas en un modelo de contabilidad para todos los vasos de precipitados en el mismo tiempo (segundo índice $j$ es de precipitados de ID): $$y_j(t) = a + e^{-(k_i + \alpha_j)t} + \epsilon$$ donde $\epsilon$ se distribuye normalmente error de la SD $\sigma$, $k_i$ es uno de los 3 media de $k$ valores de la sustancia $i$, $\alpha_j$ normalmente se distribuyen al azar en la desviación de un específico vaso de precipitados de la $k_i$ sustancia media, con una sustancia específica SD ($\sigma_{\alpha{}i}$). Este es ahora un no-lineal de efectos mixtos modelo, que puede ser instalado utilizando diversos software. Después de esto tienes la $k_i$ valores y sus errores estándar.

La siguiente pregunta es cómo poner a prueba la hipótesis de que la $k_1 > k_2 > k_3$. Puede ser "limpiador" para formular esta hipótesis en el Bayesiano. Sin embargo, usted utiliza la palabra prueba, entonces usted probablemente querrá una significación de la prueba – pero para hacer eso tienes que tener un control más específico de la hipótesis alternativa (o de la familia de las hipótesis).

3voto

Elias Puntos 101

Si entiendo tu pregunta correctamente, usted debería ser capaz de lograr lo que usted desea hacer el uso de un no-lineal modelo de efectos mixtos. Si utiliza R, puede utilizar el nlme paquete. Básicamente en lo que se fija factores que tienen una covariable (a) y de un factor (sustancia o de la $i$$k_{i}$). Usted también tiene un efecto aleatorio (mediciones individuales o unidades de unitID). La cosa buena acerca de la nlme es que también permite modelar la correlación en los residuos, por ejemplo, con un AR de estructuras de covarianza.

edit: siempre me gusta usar un modelo mixto cuando se trata de medidas repetidas. Sin embargo, si usted no desea incluir un factor aleatorio, se puede modelar con gnls en el mismo paquete. gnls todavía le permite seleccionar AR como estructura de covarianza de los residuos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X