$\beta$ y $\gamma$
Como señaló Xi'an en su respuesta el $\beta$ y $\gamma$ se relacionan entre sí mediante la relación con los medios condicionales $X|Y$ y $Y|X$ (que a su vez se relacionan con un solo distribución conjunta) estos no son simétricos en el sentido de que $\beta \neq 1/\gamma$ . Este no es el caso si usted "conoce" la verdadera $\sigma$ y $\rho$ en lugar de utilizar estimaciones. Usted tiene $$\beta = \rho_{XY} \frac{\sigma_Y}{\sigma_X}$$ y $$\gamma = \rho_{XY} \frac{\sigma_X}{\sigma_Y}$$
o podría decir
$$\beta \gamma = \rho_{XY}^2 \leq 1$$
Ver también regresión lineal simple en wikipedia para el cálculo del $\beta$ y $\gamma$ .
Este término de correlación es el que perturba la simetría. Cuando el $\beta$ y $\gamma$ sería simplemente la relación de la desviación estándar $\sigma_Y/\sigma_X$ y $\sigma_X/\sigma_Y$ entonces sí que serían la inversa del otro. El $\rho_{XY}$ término puede ser visto como una modificación de esto como una especie de regresión a la media .
- Con una correlación perfecta $\rho_{XY} = 1$ entonces se puede predecir completamente $X$ basado en $Y$ o viceversa. Las pendientes serán iguales $$\beta \gamma = 1$$
- Pero con una correlación menos que perfecta, $\rho_{XY} < 1$ no se pueden hacer esas predicciones perfectas y la media condicional estará algo más cerca de la media incondicional, en comparación con un simple escalado por $\sigma_Y/\sigma_X$ o $\sigma_X/\sigma_Y$ . Las pendientes de las líneas de regresión serán menos pronunciadas. Las pendientes no estarán relacionadas como el recíproco de cada una y su producto será menor que uno $$\beta \gamma < 1$$
¿Es una línea de regresión el método adecuado?
Puede que se pregunte si estas probabilidades condicionales y líneas de regresión es lo que necesita para determinar sus ratios de $X$ y $Y$ . No me queda claro cómo quieres utilizar una línea de regresión en el cálculo de un ratio óptimo.
A continuación se presenta una forma alternativa de calcular la proporción. Este método tiene simetría (es decir, si cambias X e Y, obtendrás la misma proporción).
Alternativa
Digamos que el rendimiento de los bonos $X$ y $Y$ se distribuyen según una distribución normal multivariante $^\dagger$ con correlación $\rho_{XY}$ y desviaciones estándar $\sigma_X$ y $\sigma_Y$ entonces el rendimiento de una cobertura que es la suma de $X$ y $Y$ tendrá una distribución normal:
$$H = \alpha X + (1-\alpha) Y \sim N(\mu_H,\sigma_H^2)$$
fueron $0 \leq \alpha \leq 1$ y con
$$\begin{array}{rcl} \mu_H &=& \alpha \mu_X+(1-\alpha) \mu_Y \\ \sigma_H^2 &=& \alpha^2 \sigma_X^2 + (1-\alpha)^2 \sigma_Y^2 + 2 \alpha (1-\alpha) \rho_{XY} \sigma_X \sigma_Y \\ & =& \alpha^2(\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y) + \alpha (-2 \sigma_Y^2+2\rho_{XY}\sigma_X\sigma_Y) +\sigma_Y^2 \end{array} $$
El máximo de la media $\mu_H$ estará en $$\alpha = 0 \text{ or } \alpha=1$$ o no existir cuando $\mu_X=\mu_Y$ .
El mínimo de la varianza $\sigma_H^2$ estará en $$\alpha = 1 - \frac{\sigma_X^2 -\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2 +\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y} = \frac{\sigma_Y^2-\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y} $$
Lo óptimo estará en algún lugar entre esos dos extremos y depende de cómo quiera comparar las pérdidas y las ganancias
Nótese que ahora hay una simetría entre $\alpha$ y $1-\alpha$ . No importa si se utiliza el seto $H=\alpha_1 X+(1-\alpha_1)Y$ o el seto $H=\alpha_2 Y + (1-\alpha_2) X$ . Obtendrá las mismas proporciones en términos de $\alpha_1 = 1-\alpha_2$ .
Caso de varianza mínima y relación con los componentes principales
En el caso de la varianza mínima (aquí no es necesario asumir una distribución normal multivariante) se obtiene el siguiente ratio de cobertura como óptimo $$\frac{\alpha}{1-\alpha} = \frac{var(Y) - cov(X,Y)}{var(X)-cov(X,Y)}$$ que puede expresarse en términos de los coeficientes de regresión $\beta = cov(X,Y)/var(X)$ y $\gamma = cov(X,Y)/var(Y)$ y es el siguiente $$\frac{\alpha}{1-\alpha} = \frac{1-\beta}{1-\gamma}$$
En una situación con más de dos variables/acciones/bonos se podría generalizar esto al último (menor valor propio) componente principal.
Variantes
Se puede mejorar el modelo utilizando distribuciones diferentes a la normal multivariante. También se podría incorporar el tiempo en un modelo más sofisticado para hacer mejores predicciones de valores/distribuciones futuras para el par $X,Y$ .
$\dagger$ Se trata de una simplificación, pero sirve para explicar cómo se puede, y se debe, realizar el análisis para encontrar una relación óptima sin una línea de regresión.
1 votos
El problema no es la causalidad sino los errores de medición (es que a menudo la variable dependiente Y es la que tiene un gran error de medición, lo que hace que "Y = a + B x + error" sea la expresión común) ¿Tienes una idea de los errores en la medición de X e Y.
0 votos
Para determinar la causalidad se necesita un experimento controlado. Un experimento en el que se pueda cambiar alguna variable independientemente de las demás. (o una situación muy singular en la que dos poblaciones puedan considerarse/suponerse iguales excepto por una o más variables particulares que deben considerarse como variables "independientes")
1 votos
Los valores exactos de $\beta$ y $\gamma$ se puede encontrar en esta respuesta mía a Efecto del cambio de respuestas y de las variables explicativas... y, como usted sospecha, $\beta$ no es el recíproco de $\gamma$ y el promedio $\beta$ y $1/\gamma$ no es el camino correcto. Una visión pictórica de lo que $\beta$ y $\gamma$ están minimizando está dada en La respuesta de Elvis a la misma pregunta, e introduce una regresión de "mínimos rectángulos" que podría querer .....
0 votos
..... (continuación) para considerar como alternativa al promedio $\beta$ y $1/\gamma$ o bien, idear alguna otra función de $\beta$ y $1/\gamma$ para medir lo que se busca. Asegúrese de leer los comentarios del moderador cardenal en la respuesta de Elvis; relacionan la regresión de los "mínimos rectángulos" con otros métodos estadísticos utilizados anteriormente.
3 votos
Usted se encuentra en el escenario ideal en el que la elección de la técnica tiene un impacto directo y físicamente medible; puede simplemente medir el error de cobertura fuera de la muestra para cada estimación, y compararlos. Además, normalmente la cobertura óptima se maneja mejor utilizando un modelo VECM (véase, por ejemplo, Gatarek y Johansen, 2014, Cobertura óptima con el modelo vectorial autorregresivo cointegrado ), lo que no requiere elegir el modelo de Y como función de X o viceversa.
1 votos
Puede que quieras mirar la media geométrica $\sqrt{\dfrac{\beta}{\gamma}}$ como una posibilidad (si ambos son negativos se podría tomar la raíz cuadrada negativa). Entonces mira $\dfrac{s_y}{s_x}$ que debería ser muy similar
0 votos
@MartijnWeterings X e Y son ambos rendimientos de los bonos, y estoy utilizando los cierres oficiales, por lo que pensaría que ambos se miden con la misma cantidad de error. Evidentemente ese error es distinto de cero, ya que hay ruido en cualquier precio aunque se mida con precisión en un momento dado.
0 votos
@DilipSarwate Después de leer tus enlaces parece que estoy buscando mínimos cuadrados totales . Si desea publicar una respuesta, la aceptaré.
0 votos
@ChrisHaug Fui cauteloso a la hora de elegir el mejor ajuste, ya que temía que lo mejor pudiera cambiar con el tiempo. No conocía el enfoque VECM, voy a revisar ese documento.
0 votos
@ricardo, entonces puede haber fácilmente no relación causal entre ambos. Incluso cuando se observa una fuerte correlación. ¿Cuál es el objetivo de su regresión? ¿Desea probar/encontrar algún modelo subyacente? ¿Qué vas a hacer con el $\beta$ que obtienes?
1 votos
@ricardo Tenga en cuenta que he especificado fuera de la muestra error, por lo que no el (en la muestra) encajar del modelo. Y es perfectamente posible que el ratio de cobertura óptimo cambie con el tiempo (especialmente si la relación no es realmente lineal), lo que no cambia el hecho de que averiguar la mejor estrategia de cobertura puede hacerse más directamente mediante el backtesting del modelo y la observación de los resultados.
0 votos
@MartijnWeterings el objetivo es averiguar la cantidad adecuada de activos $Y$ vender contra una unidad de activo $X$ (o viceversa). Mi problema es que la respuesta varía dependiendo de si empiezo con una unidad de $X$ y preguntar cuánto $Y$ debo vender; o si empiezo con una unidad de $Y$ y preguntar cuánto $X$ debería vender. Claramente no pueden ser ambos bueno ¡respuestas!
0 votos
@Henry Ahora que lo he pensado veo que la media geométrica es mucho mejor que la media aritmética pero no era obvio hasta que hice las cuentas. No vi que la media variaría dependiendo de si tomaba la media de $\beta$ y $1/ \gamma$ o $\gamma$ y $1/ \beta$
0 votos
@ricardo No me queda claro cómo quieres utilizar $\beta$ o $\gamma$ con el fin de obtener un ratio de cobertura óptimo. Obsérvese en la respuesta de Xi'an que estas líneas de regresión se refieren a las medias de las distribuciones condicionales de X dado Y e Y dado X (esto es independiente de la relación causal que pueda existir). Estas líneas también son diferentes, incluso cuando se tiene información perfecta sobre la distribución conjunta de X e Y....
0 votos
.... ¿Puede describir con más exactitud cómo es el proceso? Por ejemplo, ¿recogerías una muestra de pares de X e Y, luego estimarías una distribución conjunta para los dos, luego calcularías una densidad de probabilidad de beneficio para diferentes proporciones de los dos, y luego utilizarías alguna métrica o función de pérdida para calcular qué proporción es la mejor? ¿En qué basas tus decisiones? (¿Y por qué no consideras también el tiempo?)
0 votos
@MartijnWeterings Estoy intentando resolver un ratio de cobertura. Digamos que tenemos dos acciones $X$ y $Y$ que están relacionados. Deseo tener una unidad de acciones $X$ y quisiera reducir el riesgo de poseer esas acciones vendiendo $1 / \beta$ unidades de stock $Y$ . Esperaba que la regresión $Y = \alpha + \beta X$ me dirá cuántas unidades de $Y$ necesitaba vender... Me sorprendió encontrar que la respuesta cambió cuando cambié $X$ y $Y$ .
0 votos
@Henry tus consejos fueron perfectos para un arreglo a corto plazo. He pensado en las matemáticas y he comparado las medias geométricas con los ratios de vol en mis datos -- y obtengo exactamente lo mismo. ¿Hay algún caso límite en el que no sean lo mismo?
0 votos
ricardo: Hay tres problemas con la media geométrica: (a) el signo; (b) qué pasa cuando $Y$ y $X$ no están correlacionados, lo que lleva a $\beta=\gamma=0$ y (c) una cuestión filosófica que la relación estimada entre $X$ y $Y$ en realidad no tendría en cuenta la relación real entre $X$ y $Y$ (aparte del signo) ya que se puede trazar la recta de regresión resultante sólo conociendo cada una de sus medias y el cociente de cada una de sus desviaciones típicas