Actualmente estoy tratando de encontrar correlaciones altas en una serie de datos. Inicialmente pensé que podría comprobar la correlación de los datos y elegir aquellos con la correlación más alta, pero esto se ve afectado por un pequeño número de puntos.
Los datos para ello están disponibles en formato binario R en Rdata
Así que cuando llamo cor(x,y)
Obtengo un valor de 0,4187134, aunque visualmente parece que debería ser 0. Además, si se utiliza un modelo lineal, ¿también se obtiene un coeficiente significativo?
Por desgracia, las correlaciones que me interesan son bastante débiles, por ejemplo.
¿Alguien puede sugerir un método para dar una estadística o valor alto a la 2ª cifra mientras se produce un valor bajo para la 1ª cifra?
Gracias por su ayuda.