La distribución uniforme de los coeficientes de correlación en la matriz de correlación

Question

La distribución uniforme de los coeficientes de correlación en la matriz de correlación

Preguntado el 12 de Marzo, 2017: Cuando se hizo la pregunta
128 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Esta pregunta es puramente de naturaleza académica; yo no tengo ninguna aplicación para el conocimiento de la escolástica o de otro modo, otras de curiosidad.

Supongamos que usted tiene un KxN de la matriz de datos, donde cada fila representa una variable y cada columna representa una observación de cada variable, llamada M.

Supongamos que ahora generar una matriz de correlación con los datos de M. Hay una simple distribución de las variables en el K filas tal que los coeficientes de correlación de la no-diagonal de los elementos de la matriz se distribuyen aproximadamente Uniforme(0,1)? O, alternativamente, para una matriz de covarianza, en lugar de una matriz de correlación?

Preguntado el 12 de Marzo, 2017 por Tarion

Answer 1

1 Respuestas

Answer 2

4voto

jldugger Puntos 7490

No solo es posible, es fácil crear cualquier distribución $F$ alguna apoyado en el intervalo de $[-1/(N-2), 1]$, con la única condición de que $K \le N-2$. He aquí una manera. Crea conjuntos de datos en la que todas las variables tienen la misma correlación con cada uno de los otros.

Deje $\rho$ ser una variable aleatoria con distribución $F$. Definir $U \ge 1/(N-1)$ como la única solución a

$$\rho = \frac{1 + 2 U - (N-1)U^2}{2 - 2(N-2)U + (N-1)(N-2)U^2}.$$

Set $V = (N-2)U-1$ and construct the $K$ vectors, each of length $N$, given by

$$\left\{\eqalign{ X_1 &= (1, V, -U, -U, \ldots, -U) \\ X_2 &= (1, -U, V-U, -U, \ldots, -U) \\ &\ldots \\ X_K &= (1, -U, -U, \ldots, -U, V-U, \ldots, -U). }\right.$$

Each has a $1$ in the first place, $V$ in the $K+1^\text{st}$ place, and $-U$ everywhere else.

A computation (which is simple because all the $X_i$ have zero means and the same variance) shows that $\rho$ is the correlation coefficient between each $X_i$ and $X_j$. Therefore all the correlation coefficients of these $K$ random vectors of length $N$ equal $\rho$, QED.

Appendix: Illustration via simulation

This R code simulates from a given distribution $F$. Se muestra los histogramas de los coeficientes de correlación y la prueba de homogeneidad. Los comentarios explican los detalles.

#
# Specify the situation.
#
N <- 20       # Dataset size
K <- 4        # Number of variables
n.sim <- 1e4  # Simulation size
#
# Predefine some objects.
#
f <- function(rho, n) { # Maps `rho` to `U`
  (1 + (n-2)*rho + sqrt(n * (1-rho)*(1+(n-2)*rho))) / ((n-1) * (1+(n-2)*rho))
}
pattern <- cbind(diag(rep(1, K)), matrix(0, K, N-K))
mask <- lower.tri(outer(1:K, 1:K))
#
# Conduct the simulation.
#
# rF <- runif      # The random number generator
# qF <- qunif      # The quantile function
# dF <- dunif      # The density function
rF <- function(n) rbeta(n, 1, 3)
qF <- function(q) qbeta(q, 1, 3)
dF <- function(x) dbeta(x, 1, 3)
rho <- rF(n.sim)   # Draw values of `rho`
#
# Construct the data and compute their correlation coefficients.
# Each row of `sim` will record one particular correlation coefficient.
# Its columns are the iterations.
#
U <- f(rho, N)
sim <- sapply(U, function(u) {
  v <- (N-1)*u - 1
  x <- matrix(rep(c(rep(-u, N-1), 1), K), nrow=K, byrow=TRUE) + v*pattern
  cor(t(x))[mask]
})
#
# Display the distributions of the correlation coefficients.
#
n.plots <- choose(K,2)
n.rows <- floor(sqrt(n.plots))
n.cols <- ceiling(n.plots/n.rows)
par(mfrow=c(n.rows, n.cols))
breaks <- qF(seq(0, 1, by=1/20))
invisible(apply(sim, 1, function(x) {
  H <<- hist(x, main="Marginal Histogram", freq=FALSE, breaks=breaks)
  curve(dF(x), add=TRUE, col="Red", lwd=2)
  #
  # Test the uniformity with a chi-squared test.
  #
  p <- chisq.test(H$counts)$p.value
  mtext(paste0("(Test of uniformity: p = ", signif(p, 3), ")"), cex=0.75)
}))
par(mfrow=c(1,1))

Respondido el 13 de Marzo, 2017 por jldugger (7490 Puntos )

La distribución uniforme de los coeficientes de correlación en la matriz de correlación

Respuesta

Appendix: Illustration via simulation

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

La distribución uniforme de los coeficientes de correlación en la matriz de correlación

Respuesta

Appendix: Illustration via simulation

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: