Tengo dos series de datos que contiene 132 registro de las devoluciones. Uno es para el par EURUSD, el otro es para el par nzdusd. El head()
función muestra cómo algunos de los datos se ve. El coeficiente de correlación entre los dos, calculado por cor()
es $0.5178912$.
Para conseguir un mejor sentido de que el coeficiente de correlación me bootstrap corriendo cor()
1000 veces en diferentes 132 largo de muestras. Ejecuto esto en un bucle y actualización euro.nzd.corr
en cada iteración. Este es el R código que estoy usando:
head(euro)
[1] -0.001257862 -0.011637970 0.002428757 0.003602590 -0.003457319 -0.002012728
head(nzd)
[1] 0.008773255 -0.007744927 0.005498693 0.005642524 -0.000896363 0.003449576
cor(euro,nzd)
[1] 0.5178912
euro.nzd.corr <- numeric(1000)
for(i in 1:1000){
euro.nzd.corr[i] = cor(euro[sample(132,132,replace=TRUE)],nzd[sample(132,132,replace=TRUE)])
}
plot(density(euro.nzd.corr), lwd=3, col="steelblue")
Una vez que tengo los datos, me parcela de la densidad de la tabla, y conseguir esto:
Bootstrap de datos tiene una media $\approx 0$ y en su mayoría se esparce entre los $-0.3$$0.3$. Donde tiene el inicial cor()
resultado de $0.5178912$ ido? ¿Qué voy a hacer con esto? Que es mejor para concluir que las dos variables están correlacionadas frente correlación con un coeficiente de $\approx 0.52$? He hecho ninguna codificación de errores, o es la metodología aplicada simplemente errónea?