Estoy tratando de estudiar los predictores de las empresas de la contaminación de la salida de algunos productos químicos específicos. Los datos que estoy utilizando tiene muchos 0 (es decir, la empresa no contamina en absoluto con los productos químicos) y, a continuación, se continua con una larga cola derecha. He visto a otros modelo de datos de registro de la variable dependiente después de la adición de 1. Mi sensación es que esto está mal, pero no entiendo por qué. Podría alguien explicar? Este enfoque es mucho más simple de lo que yo creo que debo estar haciendo - el uso de cero-inflado de dos modelos de la parte semi-continua de datos - por lo que yo estaría encantado si resultó simplemente añadiendo 1 y el registro es correcto.
En segundo lugar, he encontrado un programa Stata ado archivo para ejecutar cero-inflado de dos modelos de la parte semi-continua de datos. Es allí una manera de incorporar los efectos fijos en este tipo de modelo?