8 votos

¿Cómo puedo comparar modelos sin ajuste?

La regresión y la máquina de aprendizaje que se utilizan en las ciencias naturales para la prueba de hipótesis, estimación de parámetros, y hacer predicciones de los modelos de ajuste a los datos. Sin embargo, cuando tengo un a priori del modelo, no quiero hacer ningún ajuste---por ejemplo, un modelo de un determinista de la física del sistema calculado a partir de primeros principios. Simplemente quiero saber qué tan bien mi modelo coincide con los datos y, a continuación, a comprender qué partes del modelo de contribuir de manera significativa para el partido. Podría alguien que me señale hacia estadísticamente rigurosa manera de hacerlo?

En términos más específicos, supongamos que tengo un sistema físico para que me mide la variable dependiente $y_i$ ($i$ rangos de 1 a $n$, el tamaño de la muestra) bajo diferentes condiciones descritas por tres variables independientes $x_{1,i}$, $x_{2,i}$, e $x_{3,i}$. Aunque el sistema real que generó los datos es complicado, he hecho algunos supuestos simplificadores para derivar un modelo teórico $f$ para el sistema, de tal manera que

$y_i = f(x_{1,i}, x_{2,i}, x_{3,i}) + \epsilon_i$,

donde $f$ es una no lineal (y no linearizable) función de las variables independientes y $\epsilon_i$ es la diferencia entre el modelo-predichos y los valores medidos. $f$ es completamente pre-especificado; no adaptación que se hace y no hay parámetros son estimados. Mi primer objetivo es determinar si $f$ es razonable modelo para el proceso que produce los valores medidos $y_i$.

También he desarrollado modelos simplificados $g(x_{1,i}, x_{2,i})$ e $h(x_{1,i})$, que se anidan en $f$ (si lo que importa en este caso). Mi segundo objetivo es determinar si $f$ coincide con los datos significativamente mejor que el $g$ o $h$, lo que sugiere que las características que lo diferencian del modelo de $f$ a partir de los modelos de $g$ e $h$ juegan un papel importante en el proceso que genera $y_i$.

Ideas tan lejos

Tal vez si hubiera algún modo de determinar el número de parámetros o el número de grados de libertad para mi modelo matemático, sería posible utilizar los procedimientos existentes como una prueba de razón de verosimilitud o AIC comparación. Sin embargo, dada la forma no lineal de $f$ y la ausencia de cualquier obvio parámetros, no estoy seguro de si es razonable asignar parámetros o asumir lo que constituye un grado de libertad.

He leído que las medidas de bondad de ajuste, tales como el coeficiente de determinación ($R^2$), puede ser utilizado para comparar el rendimiento del modelo. Sin embargo, no es claro para mí lo que el umbral para una diferencia significativa entre las $R^2$ valores podría ser. Además, porque no me ajustar el modelo a los datos, la media de los residuos no es cero y puede ser diferente para cada modelo. Por lo tanto, un bien de coincidencia modelo que tiende a la poca frecuencia de los datos de rendimiento tan pobre como un valor de $R^2$ como un modelo que era imparcial, pero que no corresponden a los datos.

También he leído un poco acerca de la bondad de ajuste de las pruebas (por ejemplo, Anderson-Darling), pero como las estadísticas, no es mi campo, no estoy seguro de qué tan bien este tipo de prueba se adapte a mi propósito. Cualquier orientación se agradece.

4voto

EdM Puntos 5716

En esta situación es esencialmente la comparación de las distribuciones de las $\epsilon_i$ entre los 3 modelos. Por lo que necesita para examinar cuestiones como:

  1. Son la media de los valores de la $\epsilon_i$ diferentes entre los 3 modelos, y es que cualquiera de estos media de los valores distintos de 0? (Que es, hay un sesgo en cualquiera de los modelos y hacer los 3 modelos difieren en prejuicio?)
  2. ¿Hay alguna relación sistemática de la $\epsilon_i$ a los valores predichos del modelo correspondiente, o a los valores de las variables independientes $x_{1,i},x_{2,i}, x_{3,1}$? Debe tener en cuenta tres variables independientes aquí, incluso si el modelo sólo se utiliza 1 o 2 de ellos.
  3. Existen diferencias significativas en las varianzas de las $\epsilon_i$ entre los 3 modelos?

Los detalles de cómo la mejor manera de acercarse a estas preguntas dependerán de la naturaleza de los datos. Por ejemplo, si los valores de $y_i$ son necesariamente positivos y tiene los típicos errores de medición proporcional a sus valores (como a menudo es el caso en la práctica), podría tener sentido para hacer este análisis sobre las diferencias entre el registro de transformadas $y_i$ registro y transformadas por las predicciones de cada uno de sus modelos.

Análisis Visual de las distribuciones de las $\epsilon_i$ entre los 3 modelos, por ejemplo, con la densidad de las parcelas, sería un primer paso importante.

Dependiendo de la naturaleza de los datos, la norma paramétrico o no paramétrico de las pruebas estadísticas de diferencias en los valores de la media, aplicado a la $\epsilon_i$ para los 3 modelos, iba a abordar el Problema 1.

Problema 2 es en esencia lo que se hace para examinar la calidad de cualquier modelo ajustado; en su caso, este análisis podría mostrar los dominios de las variables independientes sobre las que uno o más de sus pre-especificado modelos no funciona bien. Parcelas de $\epsilon_i$ frente a los valores predichos y los independientes-los valores de la variable, con el loess curvas para resaltar las tendencias, para cada uno de sus modelos, sería útil.

Si no hay ningún sesgo en los modelos y análisis del Problema 2 se muestra sin problemas, luego el resto de la número 3 es si alguno de los modelos es superior en términos de precisión/de la varianza. En el caso ideal de una distribución normal, $\epsilon_i$ dentro de cada modelo, pruebas de F puede probar la igualdad de las varianzas.

1voto

user164061 Puntos 281

Un probabilística de la comparación de los modelos, por ejemplo, la participación de algunos de probabilidad calculada a partir de la $\epsilon$ con algunos datos (y derivado de este AIC o prueba de razón), tiene poco sentido.

Esto es debido a que

  1. Ya sabemos con certeza que el modelo va a ser malo.
  2. Los residuos que no tienen ninguna relación con la hipótesis de distribución de los errores que se utiliza para poner a prueba diferentes hipótesis. (usted no tiene una estadística/probabilisitc modelo)
  3. Su objetivo no es probar una hipótesis (básica/pura ciencia), pero para caracterizar el rendimiento de la predicción de un modelo simplificado (ciencias aplicadas).

Más a menudo las personas se describen los modelos en términos del porcentaje de error en las predicciones.

Ejemplos:

Básicamente, usted puede buscar en google cualquier modelo es una simplificación de la realidad y va a encontrar la gente que describen su discrepancia con la realidad en términos de coeficientes de correlación, o el porcentaje de variación.


Quiero poner a prueba la hipótesis de que el "fenómeno" que implican x_3,i contribuye perceptiblemente a la producción de y. Modelo f incorpora Un fenómeno mientras g y h no, así que si mis hipótesis eran ciertas, predecimos que el modelo f funciona mucho mejor que cualquiera de g o h.

Para la comparación se podría considerar la posibilidad de medir el rendimiento como un ejemplo, una muestra sacada de una mayor población (hipotética) de rendimiento.

De modo que una especie de deseo para describir los parámetros de la distribución de la población de los errores de $\epsilon$ y comparar los. Esto se podría considerar como probabilísticas. Por ejemplo, usted podría frase como 'el promedio de error del modelo es $y \pm x$'. Su hipótesis acerca de los parámetros que describen la distribución de los errores.

Sin embargo, este punto de vista es un poco problemático, ya que a menudo la "muestra" que se utiliza para medir el rendimiento, no es realmente una selección al azar (por ejemplo, que son medidas a lo largo de un predifined rango o entre un seleccionado práctico conjunto de elementos). Entonces cualquier cuantificación del error en la estimación del rendimiento general no debe estar basada en un modelo para la selección al azar (por ejemplo, el uso de la varianza en la muestra para describir el te de error de la estimación). Por lo que todavía tiene mucho sentido utilizar un modelo probabilístico para describir las comparaciones. Podría ser suficiente sólo el estado descriptivo de los datos, y hacer su "cálculo" sobre la generalización sobre la base de argumentos lógicos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X