8 votos

La bondad del ajuste lineal para el modelo

Hemos montado una función no lineal a los datos observados. El siguiente paso debe ser la evaluación de la bondad de ajuste de esta función (como $R^2$ para modelos lineales).

¿Cuáles son las formas usuales para medir esto?

Edit 1:

El ajuste se realiza de la siguiente manera:

  1. Realizar una regresión lineal con las variables independientes de Un y B.
  2. Calcular la distribución de los parámetros a partir de los parámetros de regresión. (La distribución es no lineal y tiene la variable C como entrada.)
  3. Evaluar la bondad de ajuste de los lineales de la distribución mediante la comparación de los estimados para los datos observados.

Edit 2:

Ejemplos de los pasos mencionados anteriormente:

  1. Modelo de regresión: $log(y) = \beta_0 + \beta_1 \centerdot log(a) + \beta_2 \centerdot log(b)$
  2. $\rho = -\frac{\beta_0}{\beta_1}$ $\theta = \beta_2$ para el siguiente no lineal de distribución: $f(a) = \rho \centerdot a^{-\theta}$
  3. Evaluar la bondad de ajuste de $f(a)$ con un conjunto dado de $(a, f(a))$ observaciones.

2voto

AusTravel Puntos 6

Hay tal vez más, pero a mí me parece que usted sólo desea determinar la bondad de ajuste (GoF) para una función f(a), equipado para un determinado conjunto de datos (a, f(a)). Así, la siguiente sólo responde a su tercer sub-pregunta (no creo que la primera y la segunda son directamente relevantes para el tercero).

Generalmente, GoF puede ser determinado de forma paramétrica (si conoce la distribución de los parámetros de la función) o no paramétrica (si no los conocen). Mientras que usted puede ser capaz de averiguar los parámetros de la función, como parece ser exponencial o gamma, Weibull (suponiendo que los datos es continuo). Sin embargo, voy a proceder, como si no conoce los parámetros. En este caso, es un proceso de dos pasos. En primer lugar, usted necesita para determinar los parámetros de distribución para el conjunto de datos. En segundo lugar, realizar un GoF prueba para la distribución definida. Para evitar la repetición de mí mismo, en este punto me voy a referir a mi anterior respuesta a una pregunta relacionada, que contiene algunos detalles. Obviamente, esta respuesta puede ser fácilmente aplicado a la distribución, aparte del mencionado plazo.

Además de GoF pruebas, se menciona allí, usted puede considerar otra prueba de chi-cuadrado de GoF de la prueba. A diferencia de K-S y a-D pruebas, las cuales son aplicables sólo a los continuos distribuciones chi-cuadrado de GoF de prueba es aplicable a ambos discretos y continuos . Chi-cuadrado de GoF prueba puede ser realizada en R utilizando uno de los muchos paquetes de: stats paquete integrado (función chisq.test()) y vcd (paquete de función goodfit() - para datos discretos). Más detalles están disponibles en este documento.

0voto

Marcus Puntos 11

Así, en el Aprendizaje de Máquina de la cosa que se llama Validación Cruzada se realiza muy a menudo, para el propósito de un modelo de pruebas (test si de que tipo de un modelo con estas hyper-parámetros - como el número de grados de libertad, o lo que sea se adapte a su problema) - se dividen los datos varias veces en tren y prueba de conjuntos de datos, a continuación, ejecute la optimización de más de conjunto de entrenamiento y calcular lo que sea de calidad sobre las pruebas de los datos. La mayoría de manera confidencial, es ejecutar los llamados "QxT-fold cross validation". El pseudocódigo podría como:

cv_values = []
for t in range(T):
    split = randomsplit(data, number_of_parst = Q)
    for test_id in range(Q):
        model.fit(split[:test_id] + split[test_id + 1:] # test on everything excepting test_id
        cv_values.append(model.test(split[test_id]))

cv_values.mean() # whatever

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X