13 votos

Variables dependientes filogenéticas: ¿ANOVA?

Entiendo que derivar una matriz de covarianza de los datos filogenéticos para hacer $cov(X,Y) = 0$ para dos variables sobre las que estás haciendo una regresión. Pero, ¿qué ocurre si tienes una variable continua, que has demostrado previamente que depende de la filogenia, y una variable ordinal? Al ser esta última ordinal, no estoy seguro de cómo relacionar esto con la forma en que la dependencia filogenética da lugar a estadísticas de prueba sesgadas.

¿Tiene sentido calcular los contrastes independientes filogenéticos de Felsenstein en su variable continua y utilizarlos para su ANOVA?

El valor del PIC es: $$C_{ij} = \frac{(X_i - X_j)}{\sqrt{d_{ij}}} $$

Donde $X_i$ es $X$ para las especies $i, X_j$ es $X$ para las especies $j$ y $d_{ij}$ es la distancia por pares entre las especies $i$ y $j$ en el árbol filogenético.

1 votos

Hay suficientes estadísticos aplicados en CrossValidated como para considerar la posibilidad de migrar esto al sitio de estadísticas.

2 votos

Recomiendo la lista de correo r-sig-phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Incluso si no utiliza R para sus análisis, obtendrá muy buenas respuestas a su pregunta.

1voto

bohan Puntos 522

El primer paso que recomendaría es introducir una variable ficticia para cada una de las clases ordinales (ver comentarios en https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta.edu/faculty/kunovich/Soci5304_Handouts/Topic%25208_Dummy%2520Variables.doc&cd=2&ved=0CCAQFjAB&usg=AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ&sig2=9hkDU6Y2mpKcGzBTIK8jog ) y se trazan las medias respectivas del análisis de regresión de las variables ficticias. También puede comprobar si existe una tendencia en las propias variables ficticias. También puede reordenar la categoría de la variable ordinal según la respectiva magnitud estimada de las variables ficticias para un análisis posterior si hay una justificación previa (a la vista de los datos actuales) para hacerlo.

Suponiendo que el análisis previo no tiene un efecto de tendencia creciente (no necesariamente lineal) e incorporando cualquier ordenación apoyable en la propia variable ordinal, un enfoque interesante que también aborda posibles problemas de normalidad, es realizar un análisis de regresión en el que se asignan rangos a todas las variables, incluida la variable ordinal. Una razón para esta locura, citando a Wikipedia sobre el Coeficiente de Correlación de Rango de Spearman (enlace: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient ):

"El coeficiente de Spearman, como cualquier cálculo de correlación, es apropiado tanto para variables continuas como discretas, incluidas las ordinales.[1][2]"

Wikipedia presenta un ejemplo y varias formas de evaluar el error estándar de la correlación de rangos calculada para las pruebas. Tenga en cuenta que si no es estadísticamente diferente de cero, entonces una versión escalada, como en una regresión calculada basada en rangos, es igualmente no significativa.

Además, normalizaría estos rangos (dividiéndolos por el número de observaciones), lo que daría una posible interpretación del cuantil de la muestra (nótese que hay posibles refinamientos en la construcción de la distribución empírica para los datos en cuestión). También realizaría una correlación simple entre y y una variable ordinal transformada dada, de modo que la dirección de su clasificación seleccionada (por ejemplo, 1 a 4 frente a 4 a 1), produce un signo para la correlación de rangos que tiene un significado intuitivo en el contexto de su estudio.

[Editar] Tenga en cuenta que los modelos ANOVA pueden presentarse en formato de regresión con la matriz de diseño adecuada, y con cualquier modelo de regresión estándar que se investigue, el tema central es un análisis basado en la media de Y dado X. Sin embargo, en algunas disciplinas como la ecología, un enfoque diferente en las relaciones de regresión implicadas en varios cuantiles, incluyendo la mediana, ha resultado fructífero. Aparentemente, en ecología los efectos de la media pueden ser pequeños, pero no necesariamente en otros cuantiles. Este campo se denomina regresión cuantílica. Le sugiero que lo emplee para complementar su análisis actual. Como referencia, puede encontrar útil el documento 213-30, "An Introduction to Quantile Regression and the QUANTREG Procedure" de Colin(Lin) Chen en el SAS Institute.

Aquí también hay una fuente sobre el uso de las transformaciones de rango: "The Use of Rank Transforms in Regression" por Ronald L. Iman y W.J. Conover, publicado en Technometrics, Vol 21, No. 4, noviembre, 1979. El artículo señala que las regresiones que emplean transformadas de rango parecen funcionar bastante bien con datos monótonos. Esta opinión también es compartida por los profesionales de la fiabilidad, que afirman en una revista online, citando: "El método de estimación de la regresión por rangos es bastante bueno para las funciones que se pueden linealizar". Fuente: "Reliability Hotwire", número 10, diciembre de 2010.

0 votos

Un usuario anónimo ha tratado de hacer ediciones bastante extensas (IMO) a su puesto. Si no estás de acuerdo con ellos, puedes revertirlos haciendo clic en el enlace "editado hace __", buscando la última versión que prefieras y haciendo clic en "revertir".

0voto

iDev247 Puntos 152

Se desarrolló una prueba de ANOVA filogenética por Garland et al. (1993) y se aplica en el phy.anova en la función geiger paquete. El método produce valores p corregidos por la no independencia filogenética generando una distribución nula basada en la simulación de la evolución en la filogenia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X