Processing math: 100%

47 votos

si para cambiar la escala del indicador / binario / maniquí predictores de LAZO

Para el LAZO (y otros modelo de selección de procedimientos) es crucial para cambiar la escala de los predictores. El general de la recomendación que me siga es simplemente el uso de una media de 0, 1 desviación estándar de normalización para las variables continuas. Pero lo que hay que hacer con los maniquíes?

E. g. algunos ejemplos aplicados de la misma (excelente) de la escuela de verano me vinculados a la escala de las variables continuas entre 0 y 1 (no muy bien, con valores atípicos), probablemente para ser comparables a los maniquíes. Pero incluso eso no garantiza que los coeficientes deben ser del mismo orden de magnitud, y por lo tanto penalizado de manera similar, la razón clave para reescalado, ¿no?

40voto

Michal Dymel Puntos 918

Según Tibshirani (EL LAZO MÉTODO DE SELECCIÓN de VARIABLES EN EL MODELO de COX, la Estadística en Medicina, VOL. 16, 385-395 (1997)), que literalmente escribió el libro sobre métodos de regularización, se debe estandarizar los maniquíes. Sin embargo, luego de perder la sencilla interpretación de sus coeficientes. Si no, las variables no están en un campo de juego. Básicamente se está inclinando la balanza en favor de sus variables continuas (lo más probable). Por lo tanto, si su objetivo principal es el de selección de modelo, este es un flagrante error. Sin embargo, si usted está más interesado en la interpretación, a continuación, tal vez esta no es la mejor idea.

La recomendación está en la página 394:

El lazo método requiere inicial de la normalización de los regresores, por lo que la penalización esquema es justo para todos los regresores. Para categórica regresores, uno de los códigos de la variable con las variables ficticias y, a continuación, se estandarizan las variables ficticias. Como se ha señalado por el árbitro, sin embargo, la relación de escala entre continuo y las variables categóricas en este esquema puede ser algo arbitrario.

13voto

Jeff Puntos 234

Andrew Gelman entrada en el blog, Cuando para estandarizar la regresión de las entradas y cuando a dejarlos solos, es también digno de una mirada. Esta parte en particular es relevante:

Para la comparación de los coeficientes para los diferentes predictores dentro de un modelo, la estandarización obtiene el visto bueno. (Aunque no estoy de estandarizar las entradas binarias. I código como 0/1, y luego me estandarizar todas las demás entradas numéricas dividiendo por dos la desviación estándar, por lo tanto poniendo en aproximadamente la misma escala que 0/1 variables).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X