Actualmente estoy construyendo un modelo estadístico. Según datos, la varianza es constante no, y es probable que se basa en un factor. ¿Hay cualquier modelo estadístico con variación en función de otros parámetros? ¿Cuál es su nombre, y ese modelo acoplable en R?
Respuestas
¿Demasiados anuncios?Esto se ve como un estándar heteroskedastic modelo, donde tratamos de heterocedasticidad de la "vieja usanza", es decir, de forma explícita que la modelización de la varianza de error como una función de otras variables (que pueden ser los regresores sí o no). En su forma más simple el modelo de mínimos Cuadrados Ponderados.
Varias especificaciones han sido examinados en la literatura, como por ejemplo
$$\sigma^2_i = (\mathbf z_i'\alpha)^2,\;\;\;\sigma^2_i = \exp\{\mathbf z_i'\alpha\}, \;\;\;\sigma^2_i = \sigma^2(\mathbf x_i'\beta)^2$$
El último caso indica que la variación es directamente proporcional al valor esperado condicional de la variable dependiente, mientras que en las formulaciones anteriores, el $\mathbf z$ vector puede contener los regresores o de otras variables.
El modelo puede ser estimado a través de un paso de dos de mínimos cuadrados procedimiento, o por máxima verosimilitud -tenga en cuenta que el parámetro desconocido $\alpha$ es común para todos los $i$, por lo que no tenemos un "incidental" parámetros de problema.
Este enfoque siempre ha tenido el problema de misspecification que es casi seguro que ocurra en la especificación de la forma funcional que caracteriza a la heterocedasticidad. Después de la llegada de los errores estándar de White y la "heterocedasticidad robusto" de varianza-covarianza de la matriz, el principal problema con el uso de MODELOS de regresión se despejó, y el "modelado" enfoque está visiblemente menos usada que en el pasado, al menos en la Econometría.
Para mí la pregunta habla de recto-para arriba los modelos mixtos donde la típica homogénea (homoscedástica) término de error es (posiblemente) descomponer en los niveles de y (posiblemente) se explica en cada nivel utilizando las funciones.
Por ejemplo, supongamos que tenemos un modelo que se parece a esto:
(1) $y_{i} = \beta_{0} + \beta_{1}x_{1} + \beta_{2}x_{2} + \varepsilon_{i},$
donde, dicen, $x_{1}$ es algunos continua predictor, y $x_{2}$ es un nominal factor (por simplicidad).
Ahora supongamos que, como usted sugiere que la varianza de $y$ depende de $x_{2}$. Usted puede revisar su modelo como en (2):
(2) $y_{i} = \beta_{0} + \beta_{1}x_{1} + \beta_{2}x_{2} + \varepsilon_{i0} + \varepsilon_{i2},$
donde:
$\left[\begin{array}{c}\varepsilon_{0,i}\\ \varepsilon_{2,i}\end{array}\right] \sim \mathcal{N}\left(0,\Omega_{\varepsilon}\right):\Omega_{\varepsilon}=\left[\begin{array}{cc}\sigma^{2}_{\varepsilon 0} & \\ 0 & \sigma^{2}_{\varepsilon 2} \end{array}\right]$
(La covarianza en $\Omega_{\varepsilon}$ se asume cero aquí, ya que usted tiene factores con lo que yo estoy asumiendo que son categorías mutuamente exclusivas. Si usted no se siente cómodo con esa suposición, y creo que se puede estimar un covarianza plazo, $\sigma_{\varepsilon02}$, vaya por delante y que lo incluya.)
Usted puede incluso utilizar este modelo si no hay ningún efecto fijo de $x_{2}$ $y$ (es decir, si $x_{2}$ sólo contribuye a un efecto aleatorio). Esto podría llevarse a cabo de forma implícita por dejar que una cerca de cero estimación de $\beta_{2}$ ser parte de la modelo, como en (2), o explícita, como en (3):
(3) $y_{i} = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0,i} + \varepsilon_{2,i}.$