17 votos

La independencia de los residuos en un equipo basado en/experimento de simulación?

He llevado a cabo un equipo basado en la evaluación de los diferentes métodos de ajuste de un determinado tipo de modelo utilizado en el palaeo ciencias. Yo tenía un gran-ish conjunto de entrenamiento y así me aleatoria (muestreo aleatorio estratificado) establezca un conjunto de pruebas. Yo equipada $m$ diferentes métodos para el conjunto de entrenamiento muestras y el uso de la $m$ modelos resultantes predije la respuesta para el conjunto de pruebas de las muestras y se calcula un RMSEP sobre las muestras en el conjunto de prueba. Esta es una sola ejecución.

Luego repetí este proceso un gran número de veces, cada vez elegí un diferente conjunto de entrenamiento por muestreo al azar de un nuevo conjunto de pruebas.

Habiendo hecho esto, quiero investigar si alguna de las $m$ métodos tiene mejor o peor RMSEP rendimiento. También me gustaría hacer comparaciones múltiples de los pares de métodos.

Mi planteamiento ha sido un ajuste lineal de efectos mixtos (LME) del modelo, con un único efecto aleatorio para Ejecutar. Yo solía lmer() de la lme4 paquete para adaptarse a mi modelo y funciones de la multcomp paquete para realizar las comparaciones múltiples. Mi modelo era esencialmente

lmer(RMSEP ~ method + (1 | Run), data = FOO)

donde method es un factor que indica el método que se utilizó para generar las predicciones del modelo para el conjunto de pruebas y Run es un indicador para cada uno de Ejecutar de mi "experimento".

Mi pregunta es con respecto a los residuos de la LME. Dado que el único efecto aleatorio para Ejecutar estoy suponiendo que el RMSEP valores para los que se ejecutan están correlacionadas en cierto grado, pero no están correlacionados entre carreras, sobre la base de la inducida por la correlación de los efectos aleatorios ofrece.

Es esta suposición de independencia entre ejecuta válido? Si no hay una forma de tener en cuenta esto en el LME modelo o debo buscar a recurrir a otro tipo de análisis estadístico para responder a mi pregunta?

4voto

Bitwise Puntos 3141

Básicamente se está haciendo algún tipo de validación cruzada aquí para cada uno de los m métodos y quisiera ver el método que mejor desempeño. Los resultados entre carreras definitivamente va a ser dependiente, ya que se basan en los mismos datos y de haber superposición entre el tren/conjuntos de la prueba. La pregunta es si esto importa cuando venga a comparar los métodos.

Digamos que se podría realizar sólo una carrera, y se encontrará que un método es mejor que los demás. Entonces pregúntate a ti mismo - es que esto es simplemente debido a la elección específica de la prueba de conjunto? Esta es la razón por la que usted repita la prueba para diferentes tren/conjuntos de la prueba. Así, con el fin de determinar que un método es mejor que los otros métodos, ejecute muchas veces y en cada ejecución compararlo con el de otros métodos (usted tiene diferentes opciones de ver el error/rango/etc). Ahora, si usted encuentra que un método es mejor en la mayoría de las carreras, el resultado es lo que es. No estoy seguro de que es útil para dar un p-valor para este. O, si se quiere dar un p-valor, pregúntate a ti mismo ¿cuál es el modelo de fondo aquí?

1voto

phaneron Puntos 1017

Realmente no puede entender lo que usted ha hecho, pero

para Ejecutar estoy suponiendo que el RMSEP valores para los que se ejecutan están correlacionados con algún grado

Sí, que refleja lo difícil de la prueba era el conjunto en que se ejecutan

pero no están correlacionados entre pistas

No, dada la forma en que se han muestreado los conjuntos de la prueba de algunos serán más superpuesta que otros (definitivamente no es independiente de repeticiones)

Que de alguna manera se tiene que el modelo de la dependencia basado en la superposición o el diseño de la evaluación, de modo que las pistas son independientes. Me gustaría leer las estadísticas de la literatura en la validación cruzada ;-)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X