1 votos

¿Regresión lineal o polinómica? - Elección de características

Intento predecir una variable dependiente de salida $Y$ para un conjunto de 4 variables independientes - $X_1, \dots,X_4$ mediante regresión. He aquí un diagrama de dispersión de cada una de las variables dependientes frente a la variable dependiente $Y$ .

enter image description here

Regresión lineal de las características $X_1, \dots, X_4$ no fue capaz de predecir $Y$ bien. En $R^2$ de las predicciones fue de sólo 0,1. Estoy pensando que se podría obtener un buen ajuste si utilizara más características que fueran polinomios (o alguna otra función como la raíz logarítmica/cuadrada) de las características de entrada en lugar de utilizar directamente las características. He intentado ajustar Y con polinomios de segundo orden como $X_iX_j$ y $X_i^2$ . Pero no parece ayudar.

Creo que la forma de los gráficos de dispersión de $X_1$ y $X_2$ podría estar dando una pista. Sobre la base de los gráficos de dispersión aquí, ¿puede dar alguna recomendación sobre la lista de características que puedo utilizar para predecir $Y$ ? ¿Cómo puedo mejorar la predicción de $Y$ ? He probado el escalado de características y la regularización. No parecen ayudar.

Estoy utilizando scikit-learn para ajustar y predecir. Aquí está el código de ejemplo.

*X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.3, random_state=1)
lin_reg1 = LinearRegression()
lin_reg1.fit(X_train,y_train)
print('The score is {}'.format(lin_reg1.score(X_test,y_test)))*

1voto

Terry Kernan Puntos 141

Parece que tienes problemas de multicolinealidad. ¿Has mirado la correlación entre X1 y X2, así como entre X3 y X4? X3 y X4 están al límite de la identidad. Yo reduciría la dimensionalidad utilizando PCA (perdiendo inferencia sobre los predictores) o cambiaría a un GAM; un GEE puede ser útil si el problema es el resultado de una estructura de covarianza inadecuada o desconocida. Sin embargo, sus gráficos parecen ráfagas de disparos, es probable que haya elegido malos predictores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X