Tengo un modelo para la predicción de una trayectoria de x como una función de tiempo) con varios parámetros. Por el momento, tengo que calcular el error cuadrático medio (RMSE) entre la predicción de la trayectoria y la experimental grabado trayectoria. En la actualidad, me minimizar esta diferencia (RMSE) utilizando simplex (fminsearch en matlab). Mientras que este método funciona para dar un buen encaje, me gustaría comparar diferentes modelos, por lo que creo que necesito para calcular la probabilidad para que yo pueda utilizar estimación de máxima verosimilitud, en lugar de minimizar el RMSE (y, a continuación, comparar los modelos con AIC o BIC). Es allí cualquier manera estándar de hacer esto?
Respuesta
¿Demasiados anuncios?La raíz del error cuadrático medio y la posibilidad de que en realidad están estrechamente relacionados. Digamos que usted tiene un conjunto de datos de $\lbrace x_i, z_i \rbrace$ pares y desea modelo de su relación con el modelo de $f$. Usted decide a minimizar el error cuadrático
$$\sum_i \left(f(x_i) - z_i\right)^2$$
No es esto una elección totalmente arbitrario? Claro, usted quiere penalizar a las estimaciones que está completamente equivocado más que los que están sobre la derecha. Pero hay una muy buena razón para utilizar el error cuadrático.
Recuerde que la densidad Gaussiana: $\frac{1}{Z}\exp \frac{-(x - \mu)^2}{2\sigma^2}$ donde $Z$ es la normalización constante que no nos interesa por ahora. Vamos a asumir que sus datos de destino $z$ se distribuye de acuerdo a una Gaussiana. Por lo que podemos escribir la probabilidad de los datos.
$$\mathcal{L} = \prod_i \frac{1}{Z}\exp \frac{-(f(x_i) - z_i)^2}{2\sigma^2}$$
Ahora, si tomamos el logaritmo de este...
$$\log \mathcal{L} = \sum_i \frac{-(f(x_i) - z_i)^2}{2\sigma^2} - \log Z$$
... resulta que es muy estrechamente relacionado con el rms: las únicas diferencias son algunos de los términos constantes, una raíz cuadrada y una multiplicación.
Larga historia corta: Minimizar la raíz del error cuadrático medio es equivalente a minimizar la probabilidad de registro de los datos.