Processing math: 100%

3 votos

Regresión lineal con dispersión del error dependiente de la variable independiente

Supongamos que y=ax+z donde x,y,z son variables aleatorias con rango en R , E[x]=0 la distribución de probabilidad p(z|x) es

1) distribución normal N(0,σ(x)2) con media 0 y desviación típica σ(x) como función desconocida de x ;

2) distribución t del estudiante tν(x) con grados de libertad ν(x) una función desconocida de x ,

y a es una constante desconocida. Supongamos que (xi,yi)ni=1 es un conjunto de tuplas de observación muestral de (x,y) . ¿Cómo se estiman las siguientes funciones?

1) (a,σ(x)) ;

2) (a,ν(x)) .


Nota: No se trata del problema de heteroscedasticidad en el sentido convencional, en el que el parámetro de dispersión depende del índice i . El parámetro de dispersión depende ahora de la variable independiente x .

3voto

user128284 Puntos 1

Creo que puedes estimar razonablemente a con MCO en (1) y una estimación quizá más robusta en (2) como como IRLS (aunque tal vez OLS todavía podría estar bien ).

Estimación σ(x) y ν(x) es más difícil. Creo que tienes que decidir cómo parametrizar o cuantificar wrt x . Por ejemplo, si elige alguna función con parámetros θ y defina su estimación como ˆσ(x)=f(x;θ) entonces se puede ajustar numéricamente θ maximizando la log-verosimilitud sobre el conjunto de datos (xi,zi)=(xi,yiaxi) . La elección de f representa cierto nivel de "prioridad" sobre σ(x) o ν(x) .

Supongo que también puede conjuntamente estimación a y σ o ν combinando alternativamente los dos enfoques de optimización anteriores.

Enlaces relacionados

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X