6 votos

Evaluación de la precisión de un modelo matemático determinista

¿Cómo se puede evaluar la precisión de los resultados de un modelo matemático determinista?

Por ejemplo, un modelo climático puede predecir la temperatura media anual (TMA) de un lugar concreto. Puedo utilizar el modelo para predecir treinta años de TMA en la ciudad de Nueva York, $T_\text{model}$ . Ahora digamos que tengo el MAT observado en Nueva York durante los mismos 30 años, $T_\text{obs}$ .

¿Existe una prueba estadística para la hipótesis $T_\text{obs}=T_\text{model}$ ? ¿Puedo evaluar la precisión del modelo matemático?

0 votos

Concretamente, ¿hay alguna forma de comprobarlo utilizando el software estadístico R?

0 votos

Además, si no es mucha molestia, ¿podría alguien recomendarme un valor p para la prueba?

0 votos

¿Dispone de una estimación de la incertidumbre en el resultado del modelo, o se trata de una estimación puntual? Si no es así, creo que el modelo será, por definición, erróneo. Por ejemplo, si el modelo estima MAT $=20$ y la MAT real era $20 + x$ donde x es una variable continua, entonces el modelo es erróneo porque $20\neq20+x$

4voto

Rob Allen Puntos 486

Un buen primer paso sería calcular la correlación entre las predicciones del modelo ("datos A") y las temperaturas observadas ("datos B"). Las correlaciones van de -1 a +1: 0 indica que no hay relación (lineal) entre los valores predichos y los observados, mientras que los valores más altos sugieren que su modelo concuerda mejor (hasta un factor de escala) con los datos observados. Las correlaciones pueden calcularse fácilmente en R con la función cor función. En cor.test realiza algunas pruebas de asociación entre dos variables.

También deberías trazar los datos y echarles un vistazo. Puede que tu modelo no funcione igual de bien en todas las condiciones (por ejemplo, puede que no funcione a temperaturas bajo cero).

Hay cosas más sofisticadas que podrías intentar, pero creo que éstas son un primer paso razonable.

0 votos

En esta situación, la hipótesis nula de interés no es $\rho=0$ por defecto en cor.test pero $\rho=1$ lo que obviamente produciría una distribución degenerada.

0 votos

No veo cómo el cálculo del coeficiente de correlación evalúa lo bien que el modelo se ajusta a los datos. Por ejemplo, si trazo los datos A y los datos B juntos, podría resultar que el trazado produjera perfectamente una línea y = 0,5x. Esto tendría un coeficiente de correlación de 1. Pero no significa que el modelo se ajuste bien a los datos; por ejemplo, cuando x = 2000, y = 1000

0 votos

@Stask, me temo que no te sigo. ¿No sería la hipótesis nula "este modelo no puede predecir", es decir, rho=0, y la hipótesis alternativa "este modelo capta alguna información sobre la temperatura", es decir, rho>0?

3voto

mat_geek Puntos 1367

Su pregunta parece confusa. Cuando dice precisión del modelo, ¿se refiere sólo a lo bien que predice o quiere decir lo bien que simula el comportamiento del tiempo en la ciudad de Nueva York? No creo que se pueda evaluar esto último. En cuanto a lo primero, yo calcularía el error cuadrático medio de predicción. Es decir, utilizaría el modelo para predecir la temperatura media anual de cada uno de los 30 años (presumiblemente basándome en los datos disponibles que el modo necesita para obtener las estimaciones) y calcularía la diferencia cuadrática media entre dicha predicción y las temperaturas medias anuales reales registradas. Esto te da una estimación, pero no la precisión de la estimación. Por lo tanto, es posible que tenga una norma para la precisión y que desee probar la hipótesis de que la precisión es mejor que un determinado nivel. Ahora puedo dar una descripción algo vaga de cómo hacerlo. Es cierto que es vaga porque no sé qué datos se introducen en el modelo para hacer la predicción. La idea sería hacer pequeñas perturbaciones en la entrada y ver cómo estas perturbaciones afectan a la precisión de la predicción. Esto le daría una distribución de errores cuadráticos medios a partir de la cual podría estimar un valor p para su hipótesis. Todo esto supone que se dispone de una forma razonable de perturbar las entradas que caracterizaría la variabilidad de muestreo en las entradas. Las estimaciones resultantes proporcionarían una representación de la variabilidad de las predicciones individuales y, a partir de ahí, la variabilidad del error cuadrático medio estimado de la predicción.

0 votos

¿Está diciendo que un valor P requiere una estimación de la incertidumbre tanto del modelo como de la observación?

0 votos

Recuerdo vagamente una prueba estadística para este tipo de situaciones: la prueba Chi Cuadrado de bondad de ajuste. ¿Creéis que sería una prueba adecuada para mi situación? Sólo pretendo evaluar hasta qué punto el modelo se ajusta a los datos observados. Esto es lo que quiero decir con probar si el modelo es "exacto" o no

0 votos

@Abe En primer lugar, un valor p debe referirse a una prueba de hipótesis. Representa la probabilidad de que, si la hipótesis nula es cierta, se obtenga una estimación del tamaño del valor observado o superior. Así que necesitas una prueba. He sugerido probar que la precisión de la predicción (no la precisión del modelo ni la incertidumbre en las temperaturas observadas) es buena en el sentido de que el error cuadrático medio es inferior a cierta norma A. Su modelo y sus datos le proporcionan una estimación de esta precisión.

2voto

Brettski Puntos 5485

Me gustaría sugerir dos enfoques para evaluar si un modelo matemático determinista está funcionando bien o no, ninguno de los cuales implica realmente una prueba estadística, y que especialmente no implican tratar de reducir el rendimiento del modelo a un valor p.

  1. ¿Cómo de bien predice su modelo los parámetros? Si su modelo estima los parámetros a partir de los datos, ¿en qué medida coincide esta estimación con los parámetros observados? a partir de datos distintos de aquellos a los que se ajusta el modelo ?
  2. ¿Genera la respuesta correcta cuando se enfrenta a parámetros que dan lugar a un cambio conocido? Por ejemplo, si a su modelo se le dan todos los parámetros que se producen antes de una ola de calor, ¿produce correctamente dicha ola de calor?

Como ya ha sugerido otra persona, también puedes comparar el error entre la salida prevista y la salida real del sistema, aunque esto sólo te da un número que intentas minimizar, no una estimación estadística. El diseño de modelos matemáticos para ser probados estadísticamente es muy difícil de hacer al revés - los elementos que necesita generalmente tienen que ser discutidos en el paso de diseño del modelo, al igual que con los estudios.

0voto

Amit Naidu Puntos 876

Recientemente he ideado un marco de validación para las previsiones deterministas de la irradiancia solar. Se basa en la idea de que el resultado y la predicción de una previsión perfecta deben ser matemáticamente intercambiables. En general, es aplicable a la previsión de variables estocásticas continuas. Véase https://doi.org/10.1016/j.renene.2021.08.032

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X