Q1
Los ecologistas hablan continuamente de gradientes. Hay muchos tipos de gradientes, pero lo mejor es pensar en ellos como una combinación de cualquier variable que se desee o que sea importante para la respuesta. Así, un gradiente podría ser el tiempo, el espacio, la acidez del suelo o los nutrientes, o algo más complejo, como una combinación lineal de una serie de variables requeridas por la respuesta de alguna manera.
Hablamos de gradientes porque observamos especies en el espacio o en el tiempo y toda una serie de cosas varían con ese espacio o tiempo.
Q2
He llegado a la conclusión de que en muchos casos la herradura en PCA no es un problema grave si entiendes cómo surge y no haces tonterías como tomar PC1 cuando el "gradiente" en realidad está representado por PC1 y PC2 (bueno, también está dividido en PCs superiores, pero esperemos que una representación 2D esté bien).
En CA supongo que pienso lo mismo (ahora que me he visto obligado a pensar un poco en ello). La solución puede formar un arco cuando no hay una 2ª dimensión fuerte en los datos de forma que una versión doblada del primer eje, que satisface el requisito de ortogonalidad de los ejes CA, explica más "inercia" que otra dirección en los datos. Esto puede ser más grave, ya que se trata de una estructura compuesta, mientras que con PCA el arco es sólo una forma de representar las abundancias de especies en los sitios a lo largo de un único gradiente dominante.
Nunca he entendido muy bien por qué la gente se preocupa tanto por el orden incorrecto a lo largo de PC1 con una herradura fuerte. Yo replicaría que no se debe tomar sólo PC1 en tales casos, y entonces el problema desaparece; los pares de coordenadas en PC1 y PC2 se deshacen de las inversiones en cualquiera de esos dos ejes.
Q3
Si viera la herradura en un biplot PCA, interpretaría que los datos tienen un único gradiente dominante o dirección de variación.
Si viera el arco, probablemente llegaría a la misma conclusión, pero sería muy cauteloso a la hora de intentar explicar en absoluto el eje 2 de CA.
Yo no aplicaría DCA - sólo tuerce el arco de distancia (en las mejores circunstancias) de tal manera que usted no ve a rarezas en 2-d parcelas, pero en muchos casos produce otras estructuras espurias, tales como diamantes o formas de trompeta a la disposición de las muestras en el espacio DCA. Por ejemplo:
library("vegan")
data(BCI)
plot(decorana(BCI), display = "sites", type = "p") ## does DCA
Se observa una dispersión típica de los puntos de muestra hacia la izquierda del gráfico.
Q4
La respuesta a esta pregunta depende de los objetivos del análisis. Si el arco/la herradura se debiera a un único gradiente dominante, entonces en lugar de tener que representarlo como $m$ PCA, sería beneficioso poder estimar una única variable que represente las posiciones de los sitios/muestras a lo largo del gradiente.
Esto sugeriría encontrar una dirección no lineal en el espacio de alta dimensión de los datos. Uno de estos métodos es la curva principal de Hastie y Stuezel, pero existen otros métodos de colectores no lineales que podrían ser suficientes.
Por ejemplo, para algunos datos patológicos
Vemos una fuerte herradura. La curva principal intenta recuperar este gradiente subyacente o disposición/ordenación de las muestras mediante una curva suave en las m dimensiones de los datos. La siguiente figura muestra cómo el algoritmo iterativo converge en algo que se aproxima al gradiente subyacente. (Creo que se aleja de los datos en la parte superior del gráfico para acercarse más a los datos en dimensiones superiores, y en parte debido al criterio de autoconsistencia para que una curva sea declarada curva principal).
Tengo más detalles incluyendo el código en entrada en mi blog de donde tomé esas imágenes. Pero el punto principal aquí es que las curvas principales recuperan fácilmente el orden conocido de las muestras, mientras que PC1 o PC2 por sí solas no lo hacen.
En el caso del ACP, es habitual aplicar transformaciones en ecología. Las transformaciones más populares son las que devuelven una distancia no euclidiana cuando la distancia euclidiana se calcula sobre los datos transformados. Por ejemplo, la distancia de Hellinger es
$$D_{\mathrm{Hellinger}}(x1, x2) = \sqrt{\sum_{j=1}^p \left [ \sqrt{\frac{y_{1j}}{y_{1+}}} - \sqrt{\frac{y_{2j}}{y_{2+}}} \right ]^2}$$
Dónde $y_{ij}$ es la abundancia del $j$ ª especie de la muestra $i$ , $y_{i+}$ es la suma de las abundancias de todas las especies en el $i$ ª muestra. Si convertimos los datos en proporciones y aplicamos una transformación de raíz cuadrada, el ACP que preserva la distancia euclidiana representará las distancias de Hellinger en los datos originales.
La herradura es conocida y estudiada desde hace mucho tiempo en ecología; parte de la literatura temprana (además de una mirada más moderna) es
Las principales referencias de curvas son
Siendo la primera una presentación muy ecológica.
1 votos
(+1) He encontrado una respuesta razonablemente clara en ordination.okstate.edu/PCA.htm . La explicación de la "curvilinealidad" de tu cita es totalmente errónea, y eso es lo que la hace tan confusa.
2 votos
Véase también Diaconis, et al. (2008), Herraduras en el escalado multidimensional y métodos de núcleo local , Ann. Appl. Stat. vol. 2, no. 3, 777-807.
0 votos
He intentado responder a tus preguntas, pero no estoy seguro de haberlo conseguido, ya que soy ecologista y los gradientes son mi forma de pensar en estas cosas.
0 votos
@whuber: La explicación citada de la "curvilinealidad" puede ser confusa y poco clara, pero no creo que sea "totalmente errónea". Si las abundancias de las especies en función de la posición a lo largo del verdadero "gradiente" (usando un ejemplo de tu enlace) fueran todas lineales (quizás corrompidas por algo de ruido), entonces la nube de puntos sería (aproximadamente) unidimensional y PCA la encontraría. La nube de puntos se curva porque las funciones no son lineales. Un caso especial de gaussianos desplazados da lugar a una herradura.
0 votos
@Amoeba Sin embargo, el efecto herradura no es el resultado de la curvilinealidad de los gradientes de especies: surge de las no linealidades en la distribución ratios . La cita, al atribuir el efecto a las formas de los propios gradientes, no identifica correctamente la causa del fenómeno.
0 votos
@whuber: Es un buen punto.