Estoy trabajando con dos partes de una modelo de regresión para la semi-continua de datos ligeramente modificada de Duan et al.
El Duan et al. el modelo se utiliza para predecir los gastos médicos en el transcurso de un año. Hay una fracción de las personas que tienen cero gastos, y el resto han positivo gastos que son log-normal distribuido.
Las Ecuaciones De Duan et al.
$I_i = x_i\delta_1+\eta_{1i}$, $\eta_{1i} \sim N(0,1)$
Donde $\mbox{MED} > 0$ si $I \ge 0$, e $\mbox{MED} = 0$ lo contrario. La segunda ecuación es un modelo lineal en el registro de escala positivas de los gastos:
$\mbox{log}(\mbox{MED}_i|I_i > 0) = x_i\delta_2 +\eta_{2i}$, $\eta_{2i} \sim N(0,\sigma^2)$
Estoy usando un modelo similar, pero el de permitir a los valores negativos, por lo que el uso de una distribución normal de los valores en lugar de una log-normal. Estoy ajuste del modelo mediante el BayesGLM paquete en R con la normal de los priores de los coeficientes de regresión, que es equivalente a L2/Regresión Ridge.
El modelo tiene dos ecuaciones, la primera es probit para determinar si o no el caso es cero, el otro es un modelo lineal.
Me gustaría ser capaz de encontrar la media del efecto y los intervalos de confianza alrededor de la media. Sé que para cada parte del modelo, puedo calcular esto, pero no estoy seguro de cómo se calcula que para el modelo combinado.
Para el modelo lineal que puede verse en la estimación del efecto y el error estándar para obtener los intervalos de confianza, pero ¿cómo puedo capa en el modelo probit? Por ejemplo, si una variable tiene un efecto positivo en el lineal componenent y un efecto negativo en el probit componente, ¿cómo puedo averiguar si el efecto es en general positiva o no?
Duan, N., Jr., W. M., & Morris, C. (1983). Una comparación de modelos alternativos para la demanda de atención médica. Revista de Negocios Y Estadísticas Económicas