7 votos

Modelos de dos partes cero inflado para semi continua de datos

Estoy tratando de estudiar los predictores de las empresas de la contaminación de la salida de algunos productos químicos específicos. Los datos que estoy utilizando tiene muchos 0 (es decir, la empresa no contamina en absoluto con los productos químicos) y, a continuación, se continua con una larga cola derecha. He visto a otros modelo de datos de registro de la variable dependiente después de la adición de 1. Mi sensación es que esto está mal, pero no entiendo por qué. Podría alguien explicar? Este enfoque es mucho más simple de lo que yo creo que debo estar haciendo - el uso de cero-inflado de dos modelos de la parte semi-continua de datos - por lo que yo estaría encantado si resultó simplemente añadiendo 1 y el registro es correcto.

En segundo lugar, he encontrado un programa Stata ado archivo para ejecutar cero-inflado de dos modelos de la parte semi-continua de datos. Es allí una manera de incorporar los efectos fijos en este tipo de modelo?

4voto

Neal Puntos 316
  1. Desventajas de $\ln(0+c)$:

    • $c=1$ es arbitrario. Con frecuencia, el valor de $c$ cambios en las estimaciones, por lo que necesita para llevar a cabo una cuadrícula de búsqueda para la "óptima" y justificar el resultado la elección en la final
    • Masa cero puede responder de manera diferente a las covariables (extensivo vs margen intensivo puede tener diferentes DGPs)
    • Retransformación de vuelta a escala natural problema es peor en el extremo inferior si desea predecir $y$
    • A veces funciona mal. Ver Duan, N., W. G. Manning, et al. "Una Comparación de Modelos Alternativos para la Demanda de Atención Médica," Revista de Economía y Empresa de Estadísticas, 1:115-126, 1983 para citar algunos ejemplos. (cerrada JSTOR enlace, RAND documento de trabajo de enlace).
  2. No hay ninguna versión del panel de tpm. Me gustaría probar el uso de maniquíes y la agrupación en el panel de documento de identidad si computacionalmente posible. Yo también podría dar xtpoisson, fe robust o xtpqml (una escrita por el usuario wrapper) de un torbellino, justificándolo como Cuasi-MLE, que se ha desempeñado bien en el CS de simulaciones incluso cuando el número de ceros es grande.

1voto

AtliB Puntos 63

No estoy seguro sobre Stata, pero R puede ejecutar modelos cero inflado con efectos fijos. Echale un vistazo, por ejemplo, el paquete y de la `` paquete.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X