6 votos

Estimado variación lineal de los modelos de factores de

Esto puede sonar como una pregunta trivial, pero simplemente no puedo conseguir mi cabeza alrededor de ella!

Estoy tratando de evaluar el rendimiento de los diferentes modelos de riesgo (lineal factor de modelos), por calcular el sesgo de estadística. Es simplemente una función de la estimación de la varianza de los activos que son de prueba y su retorno.

Vamos a considerar el siguiente modelo, $M_1$

$R$ = a + $b_1$$F_1$ + $b_2$$F_2$ + e

= a + $B*F$ + e

donde R es el retorno de los activos, F son el factor primas, B son el factor de exposiciones, una es una constante y e es el residual

El estimado de los activos de la varianza utilizando $M_1$ es:

$var(R)$ = $B^T$$\Sigma$$B$ + $\Delta$

donde $\Sigma$ es la varianza-covarianza de la matriz de factores F y $\Delta$ es la varianza de la regresión de los residuos.

Sin embargo, si considero que el modelo de $M_2$, lo que ha completamente diferentes factores que $M_1$

$R$ = a + $b_3$$F_3$ + $b_4$$F_4$ + e

y calcular la estimación de la varianza del activo, tengo exactamente el mismo valor!!

Aquí está el enlace a una instantánea de los datos: los datos. La primera columna (después de la fecha de la columna) es la variable dependiente, donde el resto de las columnas son factores $F_1$, $F_2$, $F_3$, $F_4$. Aquí está el código que he usado para calcular la previsión de riesgo:

library(zoo)

data = read.csv(csv, stringsAsFactors = FALSE, na.strings= "NA")
data1.zoo = zoo(data[,c(2,3,4)], order.by = as.Date(data[,1], format="%Y-%m-%d"))
data2.zoo = zoo(data[,c(2,5,6)], order.by = as.Date(data[,1], format="%Y-%m-%d"))

Función para estimar la previsión de la varianza

get_est_var <- function(z) {
   df = as.data.frame(z)
   reg = lm(sp500 ~., data = as.data.frame(z), na.action = na.omit)
   beta = t(as.matrix(reg$coefficients[-1]))
   res = as.matrix(reg$residuals)
   sigma = as.matrix(cov(df[,-1]))

   est.var = (beta %*% tcrossprod(sigma, beta)) + (deviance(reg)/df.residual(reg))   
   est.var
}

risk1 = sqrt(get_est_var(data1.zoo))
risk2 = sqrt(get_est_var(data2.zoo))

Usted verá que los valores risk1 y risk2 son bastante similares, aunque los factores utilizados son completamente diferentes!!!

Puede alguien por favor me ilumine en cuanto a ¿cómo podemos calcular un modelo específico estimado de los activos de la varianza? Gracias por su ayuda!

REFERENCIA

Aquí es una referencia en cuanto al cálculo de la varianza en el contexto de los modelos de factores: enlace. Por favor, eche un vistazo a la fórmula en la parte inferior de la página 7. La covarianza de los factores de la fórmula está en la parte superior de la página 4. Por favor, tenga en cuenta que cada fuente de autoridad en la gestión de la cartera corrobora estas fórmulas.

Esta es otra referencia sobre la aplicación de modelos de riesgo en R: enlace a la aplicación en R. Por favor, consulte la página 10 y página 12.

4voto

Jeff Bauer Puntos 236

Existe un resultado básico en mínimos cuadrados álgebra, que dice que, en una regresión lineal y mediante MODELOS de estimación de la regresión de una variable en un conjunto de regresores, además de una constante, es equivalente (en un matemáticamente de manera exacta) para estimar el uso de la variable dependiente y los regresores como desviaciones de sus respectivos medios.

La especificación que se presenta en la referencia que siempre, ajustado por univariado de series de tiempo de regresión con una muestra de tamaño $T$ (lo siento, pero yo siempre uso $T$ para denotar la dimensión de tiempo, a diferencia de la de referencia), con una variable dependiente (en el vector de la matriz de notación para representar la totalidad de la muestra)

$$\mathbf R = a \cdot\mathbf 1 + \mathbf F\mathbf B + \mathbf u$$

Ahora escribo $\mathbf D = I_{T\times T} -\mathbf 1\left(\mathbf 1'\mathbf1\right)^{-1}\mathbf1' $ especial para la matriz de la que de-significa un vector columna, y definir

$$\tilde {\mathbf R} = \mathbf D \mathbf R,\;\; \tilde {\mathbf F} = \mathbf D \mathbf F$$ Entonces usted tiene equivalente

$$\tilde {\mathbf R} = \tilde {\mathbf F}\mathbf B + \mathbf u$$

A partir de esta alternativa (pero de nuevo, equivalente a) la representación del modelo podemos ver que la muestra varianza de la variable dependiente (me sobra la corrección del sesgo de plazo) puede ser expresado como (se utiliza una estimación de magnitudes)

$$\operatorname{\hat Var}(R) = \frac 1n \tilde {\mathbf R}'\tilde {\mathbf R} = \frac 1n\left[\tilde {\mathbf F}\hat {\mathbf B} + \hat {\mathbf u}\right]'\left[\tilde {\mathbf F}\hat {\mathbf B} + \hat {\mathbf u}\right]$$

$$=\frac 1n\hat {\mathbf B}'\tilde {\mathbf F}'\tilde {\mathbf F}\hat {\mathbf B} + \frac 1n\hat {\mathbf B}'\tilde {\mathbf F}'\hat {\mathbf u} + \frac 1n\hat {\mathbf u}'\tilde {\mathbf F}\hat {\mathbf B}+\frac 1n\hat {\mathbf u}'\hat {\mathbf u}$$

Nota: mediante la construcción, los regresores ortogonales para el término de error, y por lo tanto el 2 y 3d términos son exactamente cero. Por otra parte, $\frac 1n\tilde {\mathbf F}'\tilde {\mathbf F} = \Sigma$ ($\Sigma$ en la pregunta) para

$$\operatorname{\hat Var}(R) = \hat {\mathbf B}'\Sigma\hat {\mathbf B} + \frac 1n\hat {\mathbf u}'\hat {\mathbf u}\qquad [1]$$

que es la expresión para la varianza de la muestra de $R$ dada en la referencia, la cual vemos que se puede obtener fácilmente a través de esta representación alternativa de la modelo.

El lado izquierdo de esta ecuación es la varianza muestral de la variable dependiente. Esta magnitud debería no ser afectado por la elección de regresores -y así tomar cualquier conjunto de regresores, se expresan en la media de la desviación de la forma, la ejecución de una regresión, la obtención de un nuevo conjunto de residuos y, a continuación, conectar todas estas en el lado derecho de la ecuación, debe dar exactamente el mismo resultado. Y lo hace, como el OP encontrado numéricamente, que también puede ser demostrado por cualquier conjunto de regresores. Definir $\mathbf M_F$ a ser el residual-maker de la matriz de la regresión, $\mathbf M_F = I - \mathbf P_F$ donde $\mathbf P_F$ es la proyección de la matriz $P_F = \tilde {\mathbf F}\Big(\tilde {\mathbf F}'\tilde {\mathbf F}\Big)^{-1}\tilde {\mathbf F}'$

A continuación, utilizando las expresiones para los coeficientes estimados y los residuos que hemos

$$n\cdot RHS =\left[\Big(\tilde {\mathbf F}'\tilde {\mathbf F}\Big)^{-1}\tilde {\mathbf F}'\tilde {\mathbf R}\right]' \tilde {\mathbf F}'\tilde {\mathbf F}\Big(\tilde {\mathbf F}'\tilde {\mathbf F}\Big)^{-1}\tilde {\mathbf F}'\tilde {\mathbf R} + \left(\mathbf M_F\tilde {\mathbf R}\right)'\left(\mathbf M_F\tilde {\mathbf R}\right)$$

$$= \tilde {\mathbf R}'\tilde {\mathbf F}\Big(\tilde {\mathbf F}'\tilde {\mathbf F}\Big)^{-1}\tilde {\mathbf F}'\tilde {\mathbf F}\Big(\tilde {\mathbf F}'\tilde {\mathbf F}\Big)^{-1}\tilde {\mathbf F}'\tilde {\mathbf R} + \tilde {\mathbf R}'\mathbf M_F\mathbf M_F\tilde {\mathbf R}$$

donde hemos utilizado el hecho de que $\mathbf M_F$ siempre es una matriz simétrica. La simplificación y usando el hecho de que el residuo fabricante de la matriz también es idempotente, tenemos

$$n\cdot RHS =\tilde {\mathbf R}'\tilde {\mathbf F}\Big(\tilde {\mathbf F}'\tilde {\mathbf F}\Big)^{-1}\tilde {\mathbf F}'\tilde {\mathbf R} + \tilde {\mathbf R}'\mathbf M_F\tilde {\mathbf R}$$

y usando la relación entre la residula fabricante y de la matriz de proyección que hemos

$$n\cdot RHS =\tilde {\mathbf R}'\mathbf P_F\tilde {\mathbf R} + \tilde {\mathbf R}'\mathbf M_F\tilde {\mathbf R} = \tilde {\mathbf R}'(I-\mathbf M_F)\tilde {\mathbf R} + \tilde {\mathbf R}'\mathbf M_F\tilde {\mathbf R}$$

$$\Rightarrow n\cdot RHS = \tilde {\mathbf R}'\tilde {\mathbf R} $$ $$\Rightarrow RHS = \frac 1n \tilde {\mathbf R}'\tilde {\mathbf R} $$

De modo que el lado derecho de la ecuación. $[1]$ está compuesto de tal manera como para ser matemáticamente equivalente con el resultado que se obtendría si simplemente se calcula la varianza de la muestra de la variable dependiente, independientemente de los regresores elegido.

Lo que la elección de los regresores afecta es la asignación de la varianza de la muestra en un "factor común componente" $\hat {\mathbf B}'\Sigma\hat {\mathbf B}$ y en un "activo específico del componente" $\frac 1n\hat {\mathbf u}'\hat {\mathbf u}$ (que es la "traducción" en el contexto de un modelo específico de la tradicional declaración acerca de la"explicado" y "inexplicable" de la porción de la varianza de la variable dependiente).

Así pues, usted desea calcular algo llamado el "sesgo de la estadística", que implica "la estimación de la varianza del activo y su retorno". Si usted debe esperar que este dato debería tener un valor diferente dependiendo de los regresores elegido, entonces, a la luz de lo anterior, esto podría suceder si
1) En el sesgo de la estadística, sólo una de las dos partes de la descompuesto varianza de la muestra entra(es decir, sólo uno de los dos términos del lado derecho de la ecuación. $[1]$

y / o
2) La elección de los regresores afecta a los planteamientos "de retorno".

Yo no estoy familiarizado con la definición de la tendencia estadística y lo que se intenta medir así que no te puedo ayudar más que eso.

1voto

jldugger Puntos 7490

Los valores no son exactamente los mismos, pero están muy cerca. Este parece ser puramente accidental cuando nos fijamos en lo que pasa en ellos:

Model    beta'*Sigma*beta  Deviance     DF    Deviance/DF   "est.var"
    1    0.0001504468      0.0005199823 1256  4.139987e-07  0.0001508608
    2    9.168255e-08      0.1896668    1256  0.0001510086  0.0001511003

En el primer modelo, el resultado es aproximadamente el $0.000151$ porque $\beta'\Sigma\beta$ es casi este valor y la desviación (dividido por la DF) añade esencialmente nada. En el segundo modelo $\beta'\Sigma\beta$ contribuye con casi nada, pero la desviación (dividido por la DF) es de aproximadamente el $0.000151.$

Es una muy buena idea para buscar en los resultados que parecen más que coincidencia, como has hecho aquí, pero los accidentes ocurren.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X