10 votos

¿Por qué no registro de transformación de todas las variables que no son de principal interés?

Los libros y las discusiones suelen indicar que cuando se enfrenta a problemas (de los que hay pocos) con un indicador de registro-transformimg es una posibilidad. Ahora, yo entiendo que esto depende de las distribuciones y la normalidad en los predictores no es una suposición de regresión; pero el registro de la transformación que hace que los datos sean más uniforme, menos afectada por los valores extremos y así sucesivamente.

Pensé acerca de registro de la transformación de toda mi continuo de las variables que no son de principal interesr, es decir, variables que yo sólo ajustar.

Es que mal? Bueno? Inútil?

26voto

AdamSane Puntos 1825

Ahora, yo entiendo que esto depende de las distribuciones y la normalidad en los predictores

registro de la transformación que hace que los datos sean más uniforme

Como un general de la demanda, esto es falso --- pero incluso si fuera el caso, ¿por qué la uniformidad de ser importante?

Considere, por ejemplo,

i) un binario predictor de tomar sólo los valores 1 y 2. Tomar registros dejaría un binario como predictor de tomar sólo los valores 0 y log 2. Realmente no afecta en nada, excepto el intercepto y la escala de términos relacionados con este predictor. Incluso el p-valor de la predictor sería sin cambios, al igual que los valores ajustados.

enter image description here

ii) considerar la posibilidad de un sesgo predictor. Ahora tomar registros. Normalmente se hace más a la izquierda de sesgo.

enter image description here

iii) datos uniforme se convierte en el izquierdo sesgar

enter image description here

(a menudo no es siempre tan extrema de un cambio, a pesar de que)

menos afectada por los valores extremos

Como un general de la demanda, esto es falso. Considerar la baja de los valores atípicos en un predictor.

enter image description here

Pensé acerca de registro de la transformación de toda mi continuo de las variables que no son de interés principal

¿Con qué fin? Si originalmente, las relaciones fueron lineal, no estaría de más ser.

enter image description here

Y si ya eran curvas, haciendo esto de forma automática puede hacer peor (más curvo), no mejor.

--

Tomando los registros de un predictor (ya sea de principal interés o no) puede a veces ser adecuado, pero no siempre es así.

10voto

AusTravel Puntos 6

En mi opinión, no tiene sentido realizar la transformación de registro (y cualquier transformación de datos, para el caso) sólo por el bien de ella. Como respuestas anteriores mencionados, dependiendo de los datos, algunas transformaciones sería inválida, o inútil. Le recomiendo que lea el siguiente en mi humilde opinión excelente material introductorio sobre la transformación de los datos: http://fmwww.bc.edu/repec/bocode/t/transint.html. Por favor, tenga en cuenta que el código de los ejemplos en este documento está escrito en Stata idioma, pero de lo contrario el documento es genérico suficiente y, por lo tanto, útil para los usuarios de Stata así.

Algunas simples técnicas y herramientas para afrontar los más comunes problemas relacionados con datos, tales como la falta de normalidad, valores atípicos y la mezcla de distribuciones se pueden encontrar en este artículo (nota, que la estratificación como un acercamiento para tratar con la mezcla de distribución es probablemente el más simple de uno más general y complejo de enfoque es el análisis de mezclas, también conocido como finito modelos de mezcla, una descripción de lo que está más allá del alcance de esta respuesta). Box-Cox transformación, menciona brevemente en las dos referencias anteriores, es un lugar importante de transformación de datos, especialmente para los no-normalidad de los datos (con algunas salvedades). Para más detalles sobre el Box-Cox de transformación, por favor consulte este artículo de introducción.

8voto

anand Puntos 199

Registro de la transformación no SIEMPRE hacer las cosas mejor. Obviamente, no se puede iniciar sesión de transformación de variables que lograr cero o valores negativos, e incluso positivo que abrazo cero podría salir con valores atípicos negativos si log-transformado.

Usted no sólo debe rutinariamente registro de todo, pero es una buena práctica para PENSAR en transformar seleccionado positivo predictores (convenientemente, a menudo un registro, pero tal vez algo más) antes de que el ajuste de un modelo. Lo mismo va para la variable de respuesta. El conocimiento de la materia es demasiado importante. La teoría de la física o la sociología o lo que podría conducir naturalmente a ciertas transformaciones. Por lo general, si usted ve las variables que están positivamente sesgada, que es donde un registro (o tal vez de una raíz cuadrada o una recíproca) podría ayudar.

Algunos de regresión textos parecen sugerir que usted tiene que mirar a los gráficos de diagnóstico antes de considerar cualquier transformaciones, pero no estoy de acuerdo. Creo que es mejor hacer el trabajo lo mejor que pueden hacer estas opciones antes de la colocación de los modelos, de modo que usted tenga el mejor punto de partida posible; a continuación, mira el diagnóstico para ver si necesita ajustar a partir de ahí.

-3voto

Milou Puntos 31

1) los datos de recuento (y>0) -> log(y) o y=exp(b0+servicio bixi) 2) los datos del conteo + cero (y>=0) -> obstáculo (modelo binomial+recuento de reg.) 3) todos los multyplicative efectos (y los errores) será aditiva 4) la varianza ~ significa -> log(y) o y=exp(b0+servicio bixi) 5) ...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X