Digamos que yo soy la construcción de un modelo de regresión logística donde la variable dependiente es binaria y puede tomar los valores de 0 o 1. Deje que las variables independientes se x1,x2,...,xm - hay m variables independientes. Digamos que para el kth variable independiente, el análisis bivariado muestra una forma de U de la tendencia - es decir, si el grupo I xk a 20 papeleras de cada una contiene aproximadamente el mismo número de observaciones y calcular el "mal tipo" para cada bin - # de observaciones donde y = 0 / total de observaciones en cada bin - luego me sale una en forma de U de la curva.
Mis preguntas son:
- Puedo utilizar directamente xk como entrada, mientras que la estimación de la beta de parámetros? Son alguno de los supuestos estadísticos violado que podría causar un error significativo en la estimación de los parámetros?
- Es necesario 'alinear' esta variable a través de una transformación (registro, plaza, producto con el mismo, etc.)?