5 votos

¿Puedo usar un modelo lineal estimado con lazo para la interpretación?

Si todas las suposiciones son correctas, un modelo lineal puede ser utilizado para la interpretación. Es posible entender si una variable tiene un efecto significativo sobre la respuesta y si es así, también es posible entender que es la media de la variación de la respuesta cuando un predictor varía de x a x+1 (mientras que el resto de los predictores que permanecen fijos).
No entiendo si puedo usar un modelo lineal equipado con lazo para la interpretación o no.
Puedo decir que los predictores cuyos coeficientes son puestas a cero por el lazo no tienen un efecto significativo sobre la respuesta? Puedo decir que el coeficiente representa la media de la variación de la respuesta cuando un predictor varía de x a x+1 (mientras que el resto de los predictores que permanecen fijos)? Qué tengo que hacer diagnósticos para el modelo estimado con lazo a comprender si las suposiciones son correctas? Gracias.

2voto

EdM Puntos 5716

En primer lugar, en términos de la interpretación de los modelos lineales, estoy asumiendo que cuando Se dice "es posible entender si una variable tiene un efecto significativo en la respuesta" te refieres a esto en el sentido de una asociación con la respuesta en lugar de un efecto causal sobre la respuesta. A menos que tenga otra evidencia de una relación causal, es importante guardia contra la tentación de la inferencia causal a partir de una regresión.

En términos del modelo que se eligió a través de LAZO, la interpretación de los coeficientes de regresión es como en la regresión lineal, en la medida en que representan la relación del cambio esperado en la variable de respuesta con un cambio en una variable independiente, cuando todas las otras variables independientes en el modelo se toman en cuenta.

Pero la variable de proceso de selección en el LAZO necesariamente añade algunas medidas de precaución para su interpretación. Más importante, las variables omitidas no deben ser considerados ajenos a la respuesta. Es sólo que, basado en su criterio para la elección de la $L_1$ pena, que no es tan importante como el que se incluyen variables en el conjunto de datos que se analizan. Este es un problema particular cuando la variable de selección fue a partir de un conjunto de muy correlacionadas con las variables independientes; la elección por el LAZO de la muestra de datos a los datos de la muestra puede ser muy variable. Usted puede explorar esta posibilidad en sus propios datos, repitiendo el LAZO en múltiples muestras bootstrap y ver si seleccione siempre la misma variable independiente.

Así que para la interpretación en el segundo párrafo de mi respuesta, tal vez habría que añadir "y con cualquier contribuciones adicionales de las variables omitidas ser ignorada".

En términos de diagnóstico, que no llame a este sitio "Cruz Validado" para nada. Si aún no lo ha hecho, obtenga una copia de Una Introducción a la Estadística de Aprendizaje y aprender de ella.

-2voto

vishal vatsa Puntos 31

Dar un conjunto de mediciones de entrada x1, x2, ...xp y una medición del resultado y, el lazo se ajusta a un modelo lineal

yhat=b0 + b1*x1+ b2*x2 + ... bp*xp

El criterio que se utiliza es:

Minimizar la suma( (y-yhat)^2 ) sujeto a la suma de[valor absoluto(bj)] <= s

La primera suma se toma sobre las observaciones (casos) en el conjunto de datos. El obligado "s" es un parámetro de ajuste. Cuando la "s" es lo suficientemente grande, la restricción no tiene ningún efecto y que la solución es sólo el habitual lineal múltiple de mínimos cuadrados de la regresión de y sobre x1, x2, ...xp.

Sin embargo, cuando para pequeños valores de s (s>=0) las soluciones son el encogimiento de las versiones de los mínimos cuadrados estimados. A menudo, algunos de los coeficientes bj son cero. La elección de la "s" es como elegir el número de factores a utilizar en un modelo de regresión, y la validación cruzada es una buena herramienta para calcular el mejor valor de "s".

Esto significa, que cuando se encuentra correcta "s", que en esencia había minimizado el riesgo, que se puso a cero los coeficientes de afectados respuesta demasiado. Así, sólo tiene que utilizar este instrumento con cuidado, y usted está a salvo!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X