Digamos que yo soy la construcción de un modelo de regresión logística donde la variable dependiente es binaria y puede tomar los valores de $0$ o $1$. Deje que las variables independientes se $x_1, x_2, ..., x_m$ - hay $m$ variables independientes. Digamos que para el $k$th variable independiente, el análisis bivariado muestra una forma de U de la tendencia - es decir, si el grupo I $x_k$ a $20$ papeleras de cada una contiene aproximadamente el mismo número de observaciones y calcular el "mal tipo" para cada bin - # de observaciones donde y = 0 / total de observaciones en cada bin - luego me sale una en forma de U de la curva.
Mis preguntas son:
- Puedo utilizar directamente $x_k$ como entrada, mientras que la estimación de la beta de parámetros? Son alguno de los supuestos estadísticos violado que podría causar un error significativo en la estimación de los parámetros?
- Es necesario 'alinear' esta variable a través de una transformación (registro, plaza, producto con el mismo, etc.)?