7 votos

¿Es válida la media de las betas de Y ~ X y X ~ Y?

Me interesa la relación entre dos variables de series temporales: $Y$ y $X$ . Las dos variables están relacionadas entre sí, y la teoría no aclara cuál es la causa de la otra.

Teniendo en cuenta esto, no tengo ninguna buena razón para preferir la regresión lineal $ Y = \alpha + \beta X$ en $ X = \kappa + \gamma Y $ .

Es evidente que existe una relación entre $\beta$ y $\gamma$ Aunque recuerdo suficientes estadísticas para entender que $\beta = 1/ \gamma$ no es cierto. ¿O tal vez no es ni siquiera cerca? Estoy un poco confuso.

El problema es decidir qué cantidad de $X$ uno debe tener contra $Y$ .

Estoy considerando tomar la media de $\beta$ y $1/ \gamma$ y utilizarlo como ratio de cobertura.

Es la media de $\beta$ y $1/ \gamma$ ¿un concepto significativo?

Y como pregunta secundaria (tal vez esto debería ser otro post), ¿cuál es la forma adecuada de tratar el hecho de que las dos variables están relacionadas entre sí - lo que significa que realmente no hay una variable independiente y otra dependiente?

1 votos

El problema no es la causalidad sino los errores de medición (es que a menudo la variable dependiente Y es la que tiene un gran error de medición, lo que hace que "Y = a + B x + error" sea la expresión común) ¿Tienes una idea de los errores en la medición de X e Y.

0 votos

Para determinar la causalidad se necesita un experimento controlado. Un experimento en el que se pueda cambiar alguna variable independientemente de las demás. (o una situación muy singular en la que dos poblaciones puedan considerarse/suponerse iguales excepto por una o más variables particulares que deben considerarse como variables "independientes")

1 votos

Los valores exactos de $\beta$ y $\gamma$ se puede encontrar en esta respuesta mía a Efecto del cambio de respuestas y de las variables explicativas... y, como usted sospecha, $\beta$ no es el recíproco de $\gamma$ y el promedio $\beta$ y $1/\gamma$ no es el camino correcto. Una visión pictórica de lo que $\beta$ y $\gamma$ están minimizando está dada en La respuesta de Elvis a la misma pregunta, e introduce una regresión de "mínimos rectángulos" que podría querer .....

11voto

Lev Puntos 2212

Para ver la conexión entre ambas representaciones, tomemos un vector Normal bivariado: $$ \begin{pmatrix} X_1 \\ X_2 \end{pmatrix} \sim \mathcal{N} \left( \begin{pmatrix} \mu_1 \\ \mu_2 \end{pmatrix} , \begin{pmatrix} \sigma^2_1 & \rho \sigma_1 \sigma_2 \\ \rho \sigma_1 \sigma_2 & \sigma^2_2 \end{pmatrix} \right) $$ con condicionales $$X_1 \mid X_2=x_2 \sim \mathcal{N} \left( \mu_1 + \rho \frac{\sigma_1}{\sigma_2}(x_2 - \mu_2),(1-\rho^2)\sigma^2_1 \right)$$ y $$X_2 \mid X_1=x_1 \sim \mathcal{N} \left( \mu_2 + \rho \frac{\sigma_2}{\sigma_1}(x_1 - \mu_1),(1-\rho^2)\sigma^2_2 \right)$$ Esto significa que $$X_1=\underbrace{\left(\mu_1-\rho \frac{\sigma_1}{\sigma_2}\mu_2\right)}_\alpha+\underbrace{\rho \frac{\sigma_1}{\sigma_2}}_\beta X_2+\sqrt{1-\rho^2}\sigma_1\epsilon_1$$ y $$X_2=\underbrace{\left(\mu_2-\rho \frac{\sigma_2}{\sigma_1}\mu_1\right)}_\kappa+\underbrace{\rho \frac{\sigma_2}{\sigma_1}}_\gamma X_1+\sqrt{1-\rho^2}\sigma_2\epsilon_2$$ que significa (a) $\gamma$ no es $1/\beta$ y (b) la conexión entre las dos regresiones depende de la distribución conjunta de $(X_1,X_2)$ .

0 votos

¿Cómo podría decidir si la media de las dos betas es una mejor medida del ratio de cobertura que una u otra?

4 votos

No tengo ni idea.

0 votos

@ricardo Midiendo el error de cobertura fuera de muestra bajo cada estimación, que es en definitiva lo que se intenta minimizar.

3voto

Dilip Sarwate Puntos 16161

Convertido de un comentario.....

Los valores exactos de $\beta$ y $\gamma$ se puede encontrar en esta respuesta mía a Efecto del cambio de respuestas y variables explicativas en la regresión lineal simple y, como usted sospecha, $\beta$ no es el recíproco de $\gamma$ y el promedio $\beta$ y $\gamma$ (o promediando $\beta$ y $1/\gamma$ ) no es el camino correcto. Una visión pictórica de lo que $\beta$ y $\gamma$ están minimizando está dada en La respuesta de Elvis a la misma pregunta, y en la respuesta introduce una regresión de "mínimos rectángulos" que podría ser lo que buscas. Los comentarios que siguen a la respuesta de Elvis no deben descuidarse, ya que relacionan esta regresión de "mínimos rectángulos" con otras técnicas previamente estudiadas. En particular, observe que el moderador chl señala que este método es interesante cuando no está claro cuál es la variable de predicción y cuál la de respuesta.

3voto

user164061 Puntos 281

$\beta$ y $\gamma$

Como señaló Xi'an en su respuesta el $\beta$ y $\gamma$ se relacionan entre sí mediante la relación con los medios condicionales $X|Y$ y $Y|X$ (que a su vez se relacionan con un solo distribución conjunta) estos no son simétricos en el sentido de que $\beta \neq 1/\gamma$ . Este no es el caso si usted "conoce" la verdadera $\sigma$ y $\rho$ en lugar de utilizar estimaciones. Usted tiene $$\beta = \rho_{XY} \frac{\sigma_Y}{\sigma_X}$$ y $$\gamma = \rho_{XY} \frac{\sigma_X}{\sigma_Y}$$

o podría decir

$$\beta \gamma = \rho_{XY}^2 \leq 1$$

Ver también regresión lineal simple en wikipedia para el cálculo del $\beta$ y $\gamma$ .

Este término de correlación es el que perturba la simetría. Cuando el $\beta$ y $\gamma$ sería simplemente la relación de la desviación estándar $\sigma_Y/\sigma_X$ y $\sigma_X/\sigma_Y$ entonces sí que serían la inversa del otro. El $\rho_{XY}$ término puede ser visto como una modificación de esto como una especie de regresión a la media .

  • Con una correlación perfecta $\rho_{XY} = 1$ entonces se puede predecir completamente $X$ basado en $Y$ o viceversa. Las pendientes serán iguales $$\beta \gamma = 1$$
  • Pero con una correlación menos que perfecta, $\rho_{XY} < 1$ no se pueden hacer esas predicciones perfectas y la media condicional estará algo más cerca de la media incondicional, en comparación con un simple escalado por $\sigma_Y/\sigma_X$ o $\sigma_X/\sigma_Y$ . Las pendientes de las líneas de regresión serán menos pronunciadas. Las pendientes no estarán relacionadas como el recíproco de cada una y su producto será menor que uno $$\beta \gamma < 1$$

¿Es una línea de regresión el método adecuado?

Puede que se pregunte si estas probabilidades condicionales y líneas de regresión es lo que necesita para determinar sus ratios de $X$ y $Y$ . No me queda claro cómo quieres utilizar una línea de regresión en el cálculo de un ratio óptimo.

A continuación se presenta una forma alternativa de calcular la proporción. Este método tiene simetría (es decir, si cambias X e Y, obtendrás la misma proporción).


Alternativa

Digamos que el rendimiento de los bonos $X$ y $Y$ se distribuyen según una distribución normal multivariante $^\dagger$ con correlación $\rho_{XY}$ y desviaciones estándar $\sigma_X$ y $\sigma_Y$ entonces el rendimiento de una cobertura que es la suma de $X$ y $Y$ tendrá una distribución normal:

$$H = \alpha X + (1-\alpha) Y \sim N(\mu_H,\sigma_H^2)$$

fueron $0 \leq \alpha \leq 1$ y con

$$\begin{array}{rcl} \mu_H &=& \alpha \mu_X+(1-\alpha) \mu_Y \\ \sigma_H^2 &=& \alpha^2 \sigma_X^2 + (1-\alpha)^2 \sigma_Y^2 + 2 \alpha (1-\alpha) \rho_{XY} \sigma_X \sigma_Y \\ & =& \alpha^2(\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y) + \alpha (-2 \sigma_Y^2+2\rho_{XY}\sigma_X\sigma_Y) +\sigma_Y^2 \end{array} $$

El máximo de la media $\mu_H$ estará en $$\alpha = 0 \text{ or } \alpha=1$$ o no existir cuando $\mu_X=\mu_Y$ .

El mínimo de la varianza $\sigma_H^2$ estará en $$\alpha = 1 - \frac{\sigma_X^2 -\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2 +\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y} = \frac{\sigma_Y^2-\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y} $$

Lo óptimo estará en algún lugar entre esos dos extremos y depende de cómo quiera comparar las pérdidas y las ganancias

Nótese que ahora hay una simetría entre $\alpha$ y $1-\alpha$ . No importa si se utiliza el seto $H=\alpha_1 X+(1-\alpha_1)Y$ o el seto $H=\alpha_2 Y + (1-\alpha_2) X$ . Obtendrá las mismas proporciones en términos de $\alpha_1 = 1-\alpha_2$ .

Caso de varianza mínima y relación con los componentes principales

En el caso de la varianza mínima (aquí no es necesario asumir una distribución normal multivariante) se obtiene el siguiente ratio de cobertura como óptimo $$\frac{\alpha}{1-\alpha} = \frac{var(Y) - cov(X,Y)}{var(X)-cov(X,Y)}$$ que puede expresarse en términos de los coeficientes de regresión $\beta = cov(X,Y)/var(X)$ y $\gamma = cov(X,Y)/var(Y)$ y es el siguiente $$\frac{\alpha}{1-\alpha} = \frac{1-\beta}{1-\gamma}$$

En una situación con más de dos variables/acciones/bonos se podría generalizar esto al último (menor valor propio) componente principal.


Variantes

Se puede mejorar el modelo utilizando distribuciones diferentes a la normal multivariante. También se podría incorporar el tiempo en un modelo más sofisticado para hacer mejores predicciones de valores/distribuciones futuras para el par $X,Y$ .


$\dagger$ Se trata de una simplificación, pero sirve para explicar cómo se puede, y se debe, realizar el análisis para encontrar una relación óptima sin una línea de regresión.

1 votos

Lo siento, pero como físico, sé muy poco sobre el lenguaje (largo, corto, participaciones, etc.) relacionado con las acciones, los bonos y las finanzas. Si pudieras plantearlo en un lenguaje más sencillo podría entenderlo y trabajar con él. Mi respuesta es sólo una expresión muy simple que desconoce los detalles y las posibilidades de cómo expresar la cobertura y las acciones, pero muestra el principio básico de cómo se puede alejar del uso de una línea de regresión (volver a los primeros principios, expresar el modelo para el beneficio que está en el núcleo en lugar de utilizar líneas de regresión cuya relevancia no está directamente clara).

0 votos

Creo que lo entiendo. El problema es que 1/ _{XY} \ne p_{XY} $. indeed, $ p_{XY}$ suele cambiar bastante cuando tomamos la inversa. Su alternativa se aproxima al caso en el que estoy pensando, pero quiero comprobar una cosa: ¿permite esto participaciones no negativas? Adoptando su terminología, tendría una participación unitaria en el bono X y una participación negativa en el bono Y. Digamos que estoy a largo plazo en una unidad del bono X y a corto plazo (digamos) en 1,2 unidades del bono Y... pero podrían ser 0,2 unidades o 5 unidades, dependiendo de las matemáticas.

0 votos

largo significa que gano un 1% en un bono si el precio sube un ~1%; corto significa que pierdo un ~1% en un bono si el precio sube un ~1%. Así que la idea es que estoy largo una unidad de un bono (por lo que me beneficio de una apreciación) y estoy corto una cierta cantidad del otro bono (por lo que pierdo de una apreciación).

1voto

ozczecho Puntos 3575

Tal vez el enfoque de la "causalidad de Granger" pueda ayudar. Esto te ayudaría a evaluar si X es un buen predictor de Y o si X es un mejor de Y. En otras palabras, te dice si lo que hay que tomar más en serio es la beta o la gamma. Además, teniendo en cuenta que se trata de datos de series temporales, le indica qué parte de la historia de X cuenta para la predicción de Y (o viceversa).

Wikipedia ofrece una explicación sencilla: Se dice que una serie temporal X es causa de Granger de Y si se puede demostrar, normalmente mediante una serie de pruebas t y F sobre los valores retardados de X (y con los valores retardados de Y también incluidos), que esos valores de X proporcionan información estadísticamente significativa sobre los valores futuros de Y.

Lo que se hace es lo siguiente:

  • hacer una regresión de X(t-1) e Y(t-1) sobre Y(t)
  • haga una regresión de X(t-1), X(t-2), Y(t-1), Y(t-2) sobre Y(t)
  • regrese X(t-1), X(t-2), X(t-3), Y(t-1), Y(t-2), Y(t-3) en Y(t)

Continúe con la duración de la historia que sea razonable. Compruebe la significación de los estadísticos F de cada regresión. A continuación, haga lo mismo a la inversa (es decir, haga una regresión de los valores pasados de X e Y sobre X(t)) y vea qué regresiones tienen valores F significativos.

Un ejemplo muy sencillo, con código R, se encuentra aquí . La causalidad de Granger ha sido criticada por no establecer realmente la causalidad (en algunos casos). Pero parece que su solicitud se refiere realmente a la "causalidad predictiva", que es exactamente para lo que sirve el enfoque de la causalidad de Granger.

La cuestión es que el enfoque le dirá si X predice Y o si Y predice X (por lo que ya no se vería tentado a componer artificialmente -e incorrectamente- los dos coeficientes de regresión) y le da una mejor predicción (ya que sabrá cuánta historia de X e Y necesita conocer para predecir Y), lo que es útil para fines de cobertura, ¿verdad?

0 votos

Tengo una fuerte razón teórica para creer que ninguna de las dos es realmente una causa, y que incluso si una de ellas se convirtiera en una causa, no se mantendría a lo largo del tiempo. Así que no creo que la Causalidad de Granger sea la respuesta en este caso. En cualquier caso, he votado la respuesta, ya que es útil, especialmente el código R.

0 votos

Por eso menciono explícitamente que "la causalidad de Granger ha sido criticada por no establecer realmente la causalidad (en algunos casos)". Me parece que su pregunta se refiere más bien a establecer una "causalidad predictiva", que es para lo que sirve la causalidad de Granger. Además, el enfoque de Granger utiliza la información de tus datos de series temporales, que es un desperdicio no utilizar si los tienes. Por supuesto, puede (¿debería?) reestimar los efectos a lo largo del tiempo. Espero que los efectos de Granger sean más estables que los del método OLS transversal (puede comprobarlo de antemano, utilizando datos históricos). HTH

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X