7 votos

La confusión relacionada con la transformación utilizar

Tengo esta confusión acerca de la transformación que el uso de mis datos. El histograma de mis datos originales se parece a esto

enter image description here

Ahora he visto en la mayoría de los lugares para llevar a la transformación de registro en caso de que los datos se positivamente sesgada. Pero cuando me tome la transformación de registro puedo obtener algo como esto que es negativamente sesgada, no lo que yo deseo.

enter image description here

Si me tome la transformación de raíz cuadrada y la raíz cúbica de transformación puedo obtener como este

enter image description here enter image description here

Ahora los datos es bastante cercano a lo normal. Pero no he tenido la intuición detrás de este. ¿Por qué no funciona con la transformación de registro cuando veo en muchos lugares, la gente mencionar acerca de la transformación de registro útil cuando los datos se positivamente sesgada. Aquí la raíz cuadrada y la raíz cúbica trabajado.

Quiero saber en qué condiciones debemos utilizar la transformación de registro y en que condición para el uso del cubo de la transformación de raíz. Sugerencias?

7voto

AdamSane Puntos 1825

No es claro a partir de tu pregunta de por qué usted necesita para transformar a todos. (¿Qué está tratando de lograr y por qué?)

En cuanto a por qué los registros podrían hacer que la apariencia más simétrica en algunos casos y en otros no, no todas las distribuciones son los mismos, mientras que el registro de las transformaciones a veces puede hacer que los datos asimétricos casi simétrica, no hay ninguna garantía de que siempre lo hace.

A menudo otras transformaciones hacer mucho mejor.

Por ejemplo, los registros de trabajar muy bien en las distribuciones lognormal, mientras que las raíces cúbicas de hacerlo mejor en gamma. A continuación, $a$ es simulados a partir de una distribución lognormal, y $b$ a partir de una distribución gamma. Parecen vagamente similar, pero el registro de transformación hace que $a$ simétrica (de hecho, lo normal), mientras que la toma de $b$ a la izquierda sesgada. En la otra mano un cubo de transformación de raíz hojas de $a$ siendo un poco a la derecha de sesgo, pero hace $b$ casi simétrica (y bastante cerca de lo normal):

log vs cube root, lognormal vs gamma

Otras veces simplemente no hay transformación monotónica para lograr aproximado de simetría (por ejemplo, si su distribución es discreta y suficientemente sesgar, como un geométricas(0.5), o decir una Poisson(0.5), no monotónica transformación puede hacer razonablemente normal que cada vez que se los puso, a la izquierda de spike siempre será más alto que el siguiente).

Por cierto, puede que desee utilizar más bares en su histogramas, y tal vez considerar el uso de otras pantallas, así, conseguir una manija en la distribución de la forma. Ver mi historia con moraleja.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X