39 votos

¿Por qué se prefiere la prueba de Mantel sobre el Índice de Moran?

La prueba de Mantel es ampliamente utilizada en estudios biológicos para examinar la correlación entre la distribución espacial de los animales (posición en el espacio) con, por ejemplo, su parentesco genético, tasa de agresión u otro atributo. Muchas revistas de renombre la utilizan (PNAS, Animal Behaviour, Molecular Ecology...).

He fabricado algunos patrones que pueden ocurrir en la naturaleza, pero la prueba de Mantel parece ser bastante inútil para detectarlos. Por otro lado, Moran's I dio mejores resultados (ver los valores p debajo de cada gráfico).

¿Por qué los científicos no utilizan Moran's I en vez de eso? ¿Hay alguna razón oculta que no veo? Y si hay alguna razón, ¿cómo puedo saber (cómo deben construirse las hipótesis de manera diferente) para usar apropiadamente la prueba de Mantel o Moran's I? Un ejemplo de la vida real sería útil.

Imagina esta situación: Hay un huerto (17 x 17 árboles) con un cuervo sentado en cada árbol. Los niveles de "ruido" para cada cuervo están disponibles y deseas saber si la distribución espacial de los cuervos está determinada por el ruido que hacen.

Existen (al menos) 5 posibilidades:

  1. "Los pájaros del mismo plumaje vuelan juntos." Cuanto más similares sean los cuervos, menor será la distancia geográfica entre ellos (un solo grupo).

  2. "Los pájaros del mismo plumaje vuelan juntos." Nuevamente, cuanto más similares sean los cuervos, menor será la distancia geográfica entre ellos, (múltiples grupos) pero un grupo de cuervos ruidosos no tiene conocimiento sobre la existencia del segundo grupo (de lo contrario, se fusionarían en un solo grupo grande).

  3. "Tendencia monótona."

  4. "Los opuestos se atraen." Los cuervos similares no pueden soportarse mutuamente.

  5. "Patrón aleatorio." El nivel de ruido no tiene un efecto significativo en la distribución espacial.

Para cada caso, creé un gráfico de puntos y utilicé la prueba de Mantel para calcular una correlación (no es sorprendente que sus resultados no sean significativos, nunca intentaría encontrar una asociación lineal entre tales patrones de puntos).

introducir descripción de la imagen aquí


Datos de ejemplo: (comprimidos lo más posible)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# añadiendo colores
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Creación de la matriz de distancias geográficas (para Moran's I se invierte):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Creación de la gráfica:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Prueba de Mantel", "\n z.stat =", round(my.res$z.stat, 
   2), "\n valor p =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observado =", round(my.res$observed, 
   3), "\n esperado =",round(my.res$expected,3), "\n desv.estándar =", 
       round(my.res$sd,3), "\n valor p =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="distancia geográfica", 
       ylab="distancia comportamental")
}

P.D. en los ejemplos del sitio web de ayuda estadística de UCLA, ambas pruebas se usan en los mismos datos exactos y la misma hipótesis exacta, lo cual no es muy útil (cf., prueba de Mantel, Moran's I).

Respuesta a I.M. Has escrito:

...esta [Mantel]prueba analiza si los cuervos tranquilos están cerca de otros cuervos tranquilos, mientras que los cuervos ruidosos tienen vecinos ruidosos.

Creo que tal hipótesis NO podría ser probada por la prueba de Mantel. En ambos gráficos, la hipótesis es válida. Pero si supones que un grupo de cuervos no ruidosos puede no tener conocimiento sobre la existencia de un segundo grupo de cuervos no ruidosos, la prueba de Mantel es nuevamente inútil. Esta separación debería ser muy probable en la naturaleza (principalmente cuando estás llevando a cabo la recolección de datos a mayor escala).

introducir descripción de la imagen aquí

22voto

I.M. Puntos 296

La prueba de Mantel y el índice de Moran se refieren a dos conceptos muy diferentes.

La razón para usar el índice de Moran es la cuestión de la autocorrelación espacial: la correlación de una variable consigo misma a través del espacio. Se utiliza el índice de Moran cuando se quiere saber hasta qué punto la ocurrencia de un evento en una unidad espacial hace más probable o menos probable la ocurrencia de un evento en una unidad espacial vecina. En otras palabras (usando tu ejemplo): si hay un cuervo ruidoso en un árbol, ¿qué tan probable o improbable es que haya otros cuervos ruidosos en los alrededores? La hipótesis nula para el índice de Moran es que no hay autocorrelación espacial en la variable de interés.

La razón para usar la prueba de Mantel es la pregunta sobre similitudes o diferencias entre variables. Se utiliza la prueba de Mantel cuando se quiere saber si las muestras que son similares en términos de las variables predictoras (espaciales) también tienden a ser similares en términos de la variable dependiente (especies). Para decirlo de forma sencilla: ¿Las muestras que están cerca una de otra también son compositivamente similares y las muestras que están espacialmente distantes unas de otras también son compositivamente diferentes? Usando tu ejemplo: prueba si los cuervos silenciosos están cerca de otros cuervos silenciosos, mientras que los cuervos ruidosos tienen vecinos ruidosos. La hipótesis nula es que no hay relación entre la ubicación espacial y la variable dependiente.
Además, la prueba de Mantel parcial permite comparar dos variables mientras se controla una tercera.
Por ejemplo, se necesita la prueba de Mantel cuando se compara

  • Dos grupos de organismos, que conforman el mismo conjunto de unidades de muestra;
  • Estructura comunitaria antes y después de una perturbación;
  • Distancia genética/ecológica y distancia geográfica.

Aquí hay una buena discusión sobre la prueba de Mantel y su aplicación.

(Editado en respuesta a los nuevos ejemplos de Ladislav Nado)

Si puedo adivinar, la razón de tu confusión es que sigues pensando en el espacio y el ruido en tus ejemplos ya sea como dos variables continuas, o como una matriz de distancia (posición en el espacio) y una variable continua (ruido). De hecho, para analizar similitudes entre dos variables, uno debería pensar en ambas como matrices de distancia. Es decir:

  • una matriz (por ejemplo, para el espacio) describe las diferencias para cada par de coordenadas geográficas. El valor para 2 cuervos que están sentados uno al lado del otro es menor que el valor para cuervos que están muy separados;
  • otra matriz (para el medio ambiente, genética, u otra estructura) describe las diferencias entre los resultados medidos en puntos dados. El valor para 2 cuervos con un nivel similar de ruido (no importa si están silenciosos o ruidosos, ¡es solo una medida de similitud!) es menor que el valor para un par de cuervos con niveles de ruido diferentes.

Luego, la prueba de Mantel calcula el producto cruzado de los valores correspondientes en estas dos matrices. Permíteme subrayar nuevamente que la estadística de Mantel es la correlación entre dos matrices de distancia y no es equivalente a la correlación entre las variables, utilizadas para formar esas matrices.

Ahora tomemos dos estructuras que mostraste en las imágenes A y B.
En la imagen A, la distancia en cada par de cuervos corresponde a las similitudes en su nivel de ruido. Los cuervos con pequeñas diferencias en su nivel de ruido (cada cuervo silencioso vs. otro cuervo silencioso, cada cuervo ruidoso vs. otro cuervo ruidoso) están cerca, mientras que cada par de cuervos con grandes diferencias en su nivel de ruido (un cuervo silencioso vs. un cuervo ruidoso) están alejados uno del otro. La prueba de Mantel muestra correctamente que hay correlación espacial entre las dos matrices.
En la imagen B, sin embargo, la distancia entre los cuervos no corresponde a las similitudes en su nivel de ruido. Mientras que todos los cuervos ruidosos están juntos, los cuervos silenciosos pueden estar cerca o no. De hecho, la distancia en algunos pares de cuervos disímiles (uno silencioso + uno ruidoso) es menor que la distancia para algunos pares de cuervos similares (cuando ambos son silenciosos).
No hay evidencia en la imagen B de que si un investigador selecciona dos cuervos similares al azar, sean vecinos. No hay evidencia de que si un investigador selecciona dos cuervos vecinos (o no tan distantes) al azar, sean similares. Por lo tanto, la afirmación inicial de que En ambos gráficos la hipótesis es válida es incorrecta. La estructura como en la imagen B no muestra correlación espacial entre las dos matrices y, por lo tanto, falla la prueba de Mantel.

Por supuesto, en la realidad existen diferentes tipos de estructuras (con uno o más grupos de objetos similares o sin fronteras de grupo claras en absoluto). Y la prueba de Mantel es perfectamente aplicable y muy útil para probar lo que prueba. Si puedo recomendar otra lectura interesante, este artículo utiliza datos reales y discute el índice de Moran, el c de Geary y la prueba de Mantel en términos bastante simples y comprensibles.

Espero que todo esté un poco más claro ahora; aunque, puedo ampliar esta explicación si sientes que aún falta algo.

1 votos

Gracias por tu respuesta, pero creo que la hipótesis que mencionas (de la prueba Mantel en la vida real) no es útil con datos reales. He agregado mi respuesta arriba, estaré muy agradecido si respondes a ella. Tal vez esté equivocado.

0 votos

@Ladislav Nado He actualizado la respuesta. Por favor, no dudes en pedir más explicaciones, si es necesario.

0 votos

Muchas gracias, cuando "mascabo" los artículos que recomendaste finalmente comprendí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X