La idea básica que describes es un planteamiento válido y suele denominarse modelo de vallas (o modelo en dos partes) en lugar de un modelo de inflación cero .
Sin embargo, es fundamental que el modelo para los datos distintos de cero tenga en cuenta la eliminación de los ceros. Si se ajusta un modelo de Poisson a los datos sin ceros, es casi seguro que el ajuste será deficiente, ya que la distribución de Poisson siempre tiene una probabilidad positiva para el cero. La alternativa natural es utilizar una distribución de Poisson truncada por cero, que es el enfoque clásico de la regresión hurdle para datos de recuento.
La principal diferencia entre los modelos de inflación cero y los modelos de umbral es qué probabilidad se modela en la parte binaria de la regresión. En el caso de los modelos de umbral, se trata simplemente de la probabilidad de cero frente a la de distinto de cero. En los modelos de inflación por cero es la probabilidad de tener un exceso cero es decir, la probabilidad de un cero que no está causado por la distribución no inflada (por ejemplo, Poisson).
Para una discusión de los modelos de obstáculo y de inflación cero para datos de recuento en R, véase nuestro manuscrito publicado en JSS y también enviado como viñeta a la base de datos pscl
paquete: http://dx.doi.org/10.18637/jss.v027.i08