Justo antes de empezar la pregunta que me gustaría que todos sepan que he comprobado que los otros subprocesos en la toma de registro de variables, pero aún creo que tengo una pregunta que no ha sido tocado todavía. También me gustaría agradecer a whuber por su respuesta larga a otro registro cuestión aquí.
Esta pregunta se refiere específicamente a una de las razones de por qué tomamos los registros, es decir, la transformación de la distribución de los datos. Cuando tomamos el logaritmo de una variable es generalmente debido a la distribución de la variable es asimétrica y queremos darle una distribución normal. Un ejemplo común de esto en regresiones de MCO en la economía es una variable que denota salarios, renta, PIB, etc. Sin embargo, nadie parece mencionar el teorema del límite central (CLT). El CLT dice que la suma de muchas variables aleatorias normalmente distribuidas, incluso si las distribuciones subyacentes no están distribuidos normalmente. Si el error es la suma de las variables aleatorias $X$$Y$, $\epsilon = Y - X\beta$, entonces seguramente el error se distribuye normalmente, independientemente de la distribución de $X$$Y$. Si este tiene (y la CLT parece mantener bajo muy débil de condiciones), entonces ¿por qué es necesario transformar la variable?