La cosa más importante a hacer es para que usted pueda comprobar si el modelo tiene sentido. Tiene ajuste de un modelo lineal a tres continuo predictores, usted necesita para asegurarse de que tiene sentido hacer lo que Usted debe buscar en diagramas de dispersión de age
, height
y weight
contra y
, y ajustar los ajustes de estos predictores si es necesario.
Suponiendo que el montaje de estos predictores linealmente es razonable, el montaje del modelo completo con todos los cuatro predictores es una buena cosa que hacer.
Sólo tienes 25
puntos de datos. Si usted va en una larga búsqueda a través del espacio de todos los modelos (añadiendo y eliminando variables) tiene un riesgo extremadamente alto de falsos positivos. Así que, creo que no se necesita mucho para atrás seleccionar las variables; si lo desea, asegúrese de usar la cruz de validación para asegurarse de hacerlo, mejora el ajuste del modelo a lo invisible de datos.
La misma cosa se aplica a una búsqueda de interacciones, se tienen pocos datos, y se está corriendo un gran riesgo de falsos positivos.
Si usted desea hacer inferencias mediante el cálculo de intervalos de confianza, usted, además, debe comprobar que un gráco de los residuos frente a los valores ajustados de la modelo y asegúrese de que usted no ve ninguna patrones. Usted está mirando a ver si se parecen a ellos podría haber sido extraída de una distribución normal con varianza constante. Si esto se ve razonablemente consistente con yor de datos, entonces usted puede hacer inferencias acerca de la graduation
parámetro mediante el modelo lineal
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 140.1689 8.3191 16.849 2.77e-13
x1 -1.1428 0.1904 -6.002 7.22e-06
x2 -0.4699 0.1866 -2.518 0.0204
x3yes 2.2259 4.1402 0.538 0.5968
x4 1.2673 1.4922 0.849 0.4058
El x3
medidas de las variables de la graduación, y el parámetro se encuentra bien dentro del error de su estimación. Así pues, dado que todo lo anterior se verifica, los datos que utiliza para entrenar el modelo es que no sea incompatible con el efecto de la graduation
ser indistinguible del ruido.
Gracias por lo que somos realmente capaces de juzgar sólo a partir de su instalación el modelo completo?
Mientras todas las salvedades que se cumplan, yo creo que la mejor manera de ir sobre esto es el ajuste del modelo completo, y hacer deducciones a partir de eso. Como he dicho, cualquier inferencia que dibujar a partir de un modelo de variable es probable que la selección pasan por casualidad.
Otra forma de pensar acerca de esto es que si usted va a través de un algoritmo de selección de variables, el estándar de los errores señalados en el modelo no son correctas, son en realidad mucho más grande de lo que se informó. Para estimar la verdadera errores estándar de las estimaciones de los parámetros bajo una selección / procedimiento de ajuste, usted tendría que utilizar anidada de la validación cruzada o un bootstrap + validación cruzada. Esta sería la unidad de sus datos muy, muy fina, y de incurrir en una gran cantidad de la varianza (usted está haciendo un montón de decisiones, cada uno tiene una oportunidad de estar equivocado). Sus errores estándar sería enorme.