7 votos

¿Por qué el bootstrap correlación giran en torno a cero, mientras que el original de correlación $\approx 0.52$?

Tengo dos series de datos que contiene 132 registro de las devoluciones. Uno es para el par EURUSD, el otro es para el par nzdusd. El head() función muestra cómo algunos de los datos se ve. El coeficiente de correlación entre los dos, calculado por cor() es $0.5178912$.

Para conseguir un mejor sentido de que el coeficiente de correlación me bootstrap corriendo cor() 1000 veces en diferentes 132 largo de muestras. Ejecuto esto en un bucle y actualización euro.nzd.corr en cada iteración. Este es el R código que estoy usando:

head(euro)
[1] -0.001257862 -0.011637970  0.002428757  0.003602590 -0.003457319 -0.002012728
head(nzd)
[1]  0.008773255 -0.007744927  0.005498693  0.005642524 -0.000896363  0.003449576
cor(euro,nzd)
[1] 0.5178912
euro.nzd.corr <- numeric(1000)
for(i in 1:1000){
euro.nzd.corr[i] = cor(euro[sample(132,132,replace=TRUE)],nzd[sample(132,132,replace=TRUE)])
}
plot(density(euro.nzd.corr), lwd=3, col="steelblue")

Una vez que tengo los datos, me parcela de la densidad de la tabla, y conseguir esto:

density

Bootstrap de datos tiene una media $\approx 0$ y en su mayoría se esparce entre los $-0.3$$0.3$. Donde tiene el inicial cor() resultado de $0.5178912$ ido? ¿Qué voy a hacer con esto? Que es mejor para concluir que las dos variables están correlacionadas frente correlación con un coeficiente de $\approx 0.52$? He hecho ninguna codificación de errores, o es la metodología aplicada simplemente errónea?

23voto

Jared Farrish Puntos 120

Hay una razón obvia para que: Usted es el muestreo de ambas series por separado, por lo tanto la destrucción de la correlación. Usted probablemente querrá muestra de pares, no de observaciones en cada una de las series, por ejemplo,

index <- sample(132,132, replace=TRUE)
euro.nzd.corr[i] = cor(euro[index], nzd[index])

La fijación de su código debería permitir recuperar una distribución centrada en .5 pero es posible que desee para buscar algo de literatura antes de confiar en estas inferencias, ya que hay algunas sutilezas acerca de arranque de correlaciones. Como @NickCox señalado, el hecho de que tanto el conjunto de observaciones, son momentos de la serie también crea nuevas dificultades. Usted debe ser capaz de encontrar un montón de material en todo eso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X