Quiero incluir el término $x$, y el cuadrado de $x^2$ (variables predictoras) en una regresión porque supongo que los bajos valores de $x$ tiene un efecto positivo sobre la variable dependiente y los altos valores tienen un efecto negativo. El $x^2$ debe capturar el efecto de los valores superiores. Por tanto, espero que el coeficiente de $x$ va a ser positivo y el coeficiente de $x^2$ será negativa. Además de $x$, yo también incluyen otras variables predictoras.
He leído en algunos posts aquí que es una buena idea para centro de las variables, en este caso, para evitar la multicolinealidad. Cuándo se debe centrar sus datos y cuándo se debe estandarizar?
Debo centro de ambas variables por separado (en la media) o debo único centro $x$ y, a continuación, tomar la plaza o debo único centro $x^2$ e incluyen el original $x$?
Esto es un problema si $x$ es una variable de recuento?
Con el fin de evitar la $x$ ser una variable de recuento, pensé en dividirlo por una teórica área definida, por ejemplo, 5 kilómetros cuadrados. Este debe ser un poco similar a la de un punto de cálculo de la densidad.
Sin embargo, me temo que en esta situación mi hipótesis inicial sobre el signo de los coeficientes, no ya, como al $x=2$ $x²=4$
$x= 2 / 5 \text{ km}^2$ = $0.4 \text{ km}^2$
pero $x^2$, entonces sería menor, ya $x^2= (2/5)^2= 0.16$.