En una regresión logística múltiple necesito para estandarizar una de las variables porque necesito agregar un término cuadrático. Si puedo añadir el término cuadrático como el cuadrado de la original o el cuadrado normalizado, puedo obtener modelos muy similares, mismo AIC. Por qué? Las estimaciones de los lineales de cambio a largo plazo. Cuando me cuadrado de una variable estandarizada, tengo números positivos después de que el cuadrado de la mitad de los datos (que son negativos) y que debe por completo lío de seguridad de mis datos. ¿Por qué no? Por favor alguien puede explicar la razón matemática detrás de ella y me dice si yo definitivamente debe utilizar el cuadrado de la original y si puedo usar el cuadrado de la estandarizadas, ¿por qué funciona? Veo que esta es una pregunta de matemáticas, más que nada, pero he buscado y no pude encontrar nada relacionado con esto.
Respuesta
¿Demasiados anuncios?Deje que la variable se $x$, su media de $\mu$, y su desviación estándar $\sigma$, por lo que la estandarización de la variable es $z = (x-\mu)/\sigma$. Mediante la expansión de $z^2$ y la recolección de poderes de $x$ puede reescribir el modelo como
$$\eqalign{ y &= \beta_0 + \beta_1 x + \beta_2 z^2 + \varepsilon \\ &= \beta_0 + \beta_1 x + \beta_2 \left(\frac{x-\mu}{\sigma}\right)^2 + \varepsilon\\ &= \left(\beta_0 + \beta_2\frac{\mu^2}{\sigma^2}\right) + \left(\beta_1 + \beta_2\left(-2\frac{\mu}{\sigma}\right)\right)x + \left(\frac{\beta_2}{\sigma^2}\right)x^2 + \varepsilon \\ &= \alpha_0 + \alpha_1 x + \alpha_2 x^2 + \varepsilon }$$
donde el $\alpha_i$ son funciones de los parámetros de $\beta_i$, en función de las constantes de $\mu$ $\sigma$ y los términos de error $\varepsilon$ son los mismos que antes. (Otros multivariante de regresión términos sería sin cambios y no se muestra.) Esto significa que un modelo que se ajuste a los datos exactamente así como de los demás: las diferencias pueden ser atribuibles a la de punto flotante de errores de redondeo. (Si no son muy pequeños, es probable que usted tiene enormes problemas de colinealidad.) Por otra parte, las estimaciones de los parámetros obtenidos con el modelo puede ser convertido a estimación correspondiente con el otro modelo, siempre que el procedimiento de estimación es invariante bajo cambios lineales de parámetros (que es el caso con la Máxima Probabilidad, que es lo que se utiliza cuando un AIC se informó).
En resumen, usted no tiene que estandarizar la variable al cuadrado es: obtener un modelo equivalente, incluso cuando no está estandarizado. Debido a que el software automáticamente estandarizar todas las variables a la hora de resolver, usted es libre de escribir el modelo en cualquier forma que le resulte más interpretables.