Necesito hacer una regresión con un no-normal DV para el que no hay una buena no-lineal de la transformación (que yo sepa):
Es una puntuación que va de los 10 a los 50 años, con un pico máximo a las 10, una gota en 11 y regular de un descenso de 11 a 50. La distribución de los residuos no es normal.
Hay más o menos de 500 sujetos en el estudio, y las covariables son todos dicotómica.
Pensé en el uso de n-azulejos y la realización de una regresión ordinal de la variable resultante, pero luego termino con una alta proporción de las celdas vacías, no a causa de un bajo tamaño de la muestra, sino más bien a causa de las varias covariables que necesitan estar en el modelo.
El mejor que podía hacer por ahora es eliminar las covariables y el uso de mujeres (en lugar de, digamos, quintiles) para minimizar el número de celdas vacías. No estoy seguro, sin embargo, en qué medida, evitando las celdas vacías es importante. En comparación con el análisis original sobre un puntaje bruto, la regresión en mujeres con menos covariables parece como un montón de sacrificios.
Basado en el descenso del tamaño de la muestra, y dado el hecho de que la distribución de los residuos no es QUE lejos de ser normal, me pregunto si los resultados de la regresión sería fiable como son.