7 votos

Cómo transformar datos continuos con distribución bimodal extrema

¿Existe alguna manera de transformar una variable predictora continua (subvención) que tiene una distribución bimodal en una distribución normal (ver gráfico de densidad a continuación)? He intentado métodos de logaritmo (x+c), z-score y transformación inversa pero no puedo deshacerme de esta distribución extrema bimodal.

¿Debería considerar tratar la variable continua como categórica?

El tamaño de la muestra del conjunto de datos es de 3,000 y la variable de respuesta es dicotómica.

gráfico de densidad de una variable predictora continua

Gráfico Q-Q

5voto

AdamSane Puntos 1825

1) No hay forma de transformar una variable aleatoria discreta para que sea continua. Si toma $k$ valores distintos, ninguna transformación te dejará con más de $k$ valores distintos.

Así que no puedes transformar esto para que sea normal. Siempre va a tener dos picos grandes (o peor, con transformaciones no monótonas podrías terminar con un solo pico grande).

2) Dado que esto es un predictor, no necesitas que sea normal, por lo que esta incapacidad es inconsecuente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X