Aquí está un poco fuera de izquierda-campo de respuesta, que sólo toca el "las mejores prácticas en torno a la combinación de varios modelos" parte de su pregunta. Esto básicamente es exactamente mi tesis de honor, salvo que estoy lidiando con el complejo, altamente no-lineal de los modelos que exhiben el caos y el ruido de los modelos climáticos. Este no es probable que sea ampliamente aplicable a muchos campos, pero podría ser útil en la ecología o de la econometría.
Hasta hace relativamente poco tiempo en el modelado climático de la comunidad, los modelos fueron en gran parte acaba de destrozar juntos en un promedio no ponderado (generalmente después de la corrección del sesgo que impliquen extracción del modelo de media para todo o parte del período de la muestra). Esto es básicamente lo que el IPCC hizo para el 4º informe de evaluación (4AR), y los informes anteriores.
Esto es más o menos un ejemplo de la "verdad plus de error" la escuela del conjunto de la combinación, donde se tácita o explícitamente asumido que las series observacionales (por ejemplo. global de la temperatura, las precipitaciones locales, etc) es verdadera, y que si la toma de muestras suficientes (por ejemplo. modelo de carreras), el ruido en el modelo se ejecuta cancelar (ver (1)).
Más recientemente, los métodos de combinación de modelos basados en el rendimiento de ponderación se han utilizado. Debido a que los modelos climáticos son tan ruidosas, y tiene muchas variables y parámetros, la única manera de evaluar el desempeño (que yo sepa) están tomando la covarianza, o tomando el MSE entre la salida del modelo y el tiempo observado de la serie. Los modelos se pueden combinar luego ponderando la media basándose en que medida. Hay una buena descripción de este en (2).
Una hipótesis detrás de este método de combinación de simulaciones es la suposición de que todos los modelos están razonablemente independiente - si algunos eran altamente dependientes, que sería el sesgo de la media. Esta suposición fue razonablemente justa para el conjunto de datos usado para 4AR (CMIP3, como este conjunto de datos se compone de algunos de los modelos de muchos grupos de elaboración de modelos (por otro lado, el código se comparte en la modelización de la comunidad, por lo que todavía puede haber una cierta interdependencia. Para una mirada interesante a este respecto, consulte el apartado 3). El conjunto de datos para el próximo informe de evaluación, CMIP5, no tiene esto algo fortuito atributo - algunos equipos de modelización será la presentación de un par de carreras, mientras que algunos será la presentación de cientos de personas. Los conjuntos procedentes de los diferentes equipos que pueden ser producidos por la condición inicial peturbation, o por cambios en el modelo de la física y de la parametrisation. También, esta super conjunto no es muestreado en cuenta de manera sistemática - es sólo que nunca trae aceptación de datos (dentro de lo razonable). Esto es conocido en el campo como un "conjunto de oportunidades". Hay una buena posibilidad de que el uso de una ponderada media en un conjunto que va a git que algunos de los principales sesgo hacia los modelos con más carreras (ya que a pesar de que hay cientos de carreras, hay probablemente un número mucho menor de la verdad independiente que se ejecuta).
Mi supervisor tiene un papel en revisión en el momento en el que describe un proceso de modelo de combinación que implican el rendimiento Y la independencia de ponderación. Hay una conferencia de papel abstracto disponibles (4), voy a publicar el enlace para el papel cuando se publicó (proceso lento, no contenga la respiración). Básicamente, en este trabajo se describe un proceso que implica la adopción de la covarianza de los errores del modelo (modelo-obs), y la ponderación de los modelos que tienen una alta covarianza con todos los demás modelos (es decir. modelos altamente dependiente de los errores). El modelo de la varianza de error se calcula como bien, y se utiliza como el rendimiento de ponderación componente.
También vale la pena señalar que los modelos climáticos es, obviamente, enormemente afectado por los vaivenes de la elaboración de modelos numéricos en general. Hay una cosa que se llama "risa de la prueba" - si usted termina con un modelo de ejecución que implica que el promedio global de la temperatura de +20°C para 2050, se acaba de lanzar, porque claramente no es físicamente relevante. Obviamente este tipo de prueba es bastante subjetivo. No he requiere todavía, pero espero en el futuro cercano.
Ese es mi entendimiento de que el modelo de estado combinación en mi campo en el momento. Obviamente todavía estoy aprendiendo, así que si encontré nada especial, voy a volver y actualización de esta respuesta.
(1) Tebaldi, C. & Knutti, R., 2007. El uso de la multi-modelo conjunto en probabilístico de las proyecciones del clima. Philosophical transactions de la Royal Society Un: Matemática, Física y Ciencias de la Ingeniería, 365(1857), pp 2053–2075.
(2) Knutti, R. et al., 2010. Reunión de Expertos del IPCC sobre la Evaluación y la Combinación de Múltiples Modelo de Proyecciones del Clima.
(3) Masson, D. & Knutti, R., 2011. Modelo climático de la genealogía. Geophys. Res. Lett, 38(8), p.L08703.
(4) Abramowitz, G. & Obispo, C., 2010. La definición y ponderación para el modelo de la dependencia en el conjunto de predicción. En el Otoño de la AGU, los Resúmenes de las Reuniones. p. 07.