Tengo un conjunto de datos con tres variables, donde todas las variables son quantitatives. Vamos a llamar $y$, $x_1$ y $x_2$. Estoy ajusta un modelo de regresión en una perspectiva Bayesiana a través de la MCMC con rjags
He hecho un análisis exploratorio y el diagrama de dispersión de $y\times x_2$ sugieren que un término cuadrático debe ser utilizado. Luego he montado dos modelos
(1) $y=\beta_0+\beta_1*x_1+\beta_2*x_2$
(2) $y=\beta_0+\beta_1*x1+\beta_2*x_2+\beta_3*x_1x_2+\beta_4*x_1^2+\beta_5*x_2^2$
En el modelo 1 el tamaño del efecto de cada parámetro no es pequeña, y la credibilidad de 95% intervalo no contiene el valor de $0$.
En el modelo 2 el tamaño del efecto de los parámetros de $\beta_3$ $\beta_4$ son pequeñas y cada uno de los intervalos de credibilidad para todos los parámetros contiene $0$.
El hecho de que un intervalo creíble contiene $0$ es suficiente para decir que el parámetro no es significativo?
Después de haber ajustado el siguiente modelo
(3)$y=\beta_0+\beta_1*x_1+\beta_2*x_2+\beta_3*x^2_2$
El tamaño del efecto de cada parámetro no es pequeño, pero con excepción de $\beta_1$ todos los intervalos de credibilidad contiene $0$.
Cual es la manera correcta de hacer selección de variables en la estadística Bayesiana?
EDIT: puedo usar el Lazo en cualquier modelo de regresión, como el Beta modelo? Estoy usando un modelo con la variable de dispersión donde $$log(\sigma)=-\pmb{\delta}X$$ donde $\pmb{\delta}$ es un vector. Debo decir antes de Laplace en $\pmb{\delta}$?
EDIT2: he montado dos modelos, uno con Gaussiano priori para $\beta_j$, $\delta_j$ y uno con Laplace(doble exponencial).
El cálculo estimativo para el modelo de Gauss son
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
El cálculo estimativo para el Lazo del modelo son
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
El cálculo estimativo para $\delta_2$ $\delta_4$ reducido mucho en Lazo modelo, significa que debo eliminar este las variables del modelo?
EDIT3: El modelo con doble exponencial antes (el Lazo) gaves mí más grande de la Desviación, BIC y DIC valores que el modelo Gaussiano con los priores y yo me pongo una pequeña valores después de la eliminación de la dispersión coeficiente de $\delta_2$ en el modelo de Gauss.