Processing math: 100%

1 votos

Hallar la variación de la variable multivariante explicada por la variable univariante

Quería conocer sus opiniones sobre el siguiente tema-

Tengo un conjunto de datos sobre el perfil del microbioma y el contenido en nutrientes de plantas individuales. Quiero entender si la variación en el perfil del microbioma se explica por el contenido de nutrientes de las plantas. Sin embargo, el perfil del microbioma es un dato multivariante (con muchas características).

Detalles:

Datos del microbioma: 500 características (datos de recuento)

contenido en nutrientes: Variable continua

Los datos del microbioma tienen este aspecto (Muestras en columnas y características en filas### enter image description here

Los datos nutricionales tienen este aspecto

Muestras

AMLEAF100Y 34,56uM/mg AMLEAF113Y 33,56 uM/mg AMLEAF10 32,56uM/mg ....

¿Podría indicarme cómo puedo averiguar si el contenido de nutrientes se asocia significativamente con los datos del microbioma? Gracias de antemano

0voto

Joe Cannatti Puntos 2194

IIUC, quieres saber si al menos una característica del microbioma está asociada de alguna manera con el contenido de nutrientes.

Puede pensar en su problema como si tuviera 500 veces el problema de las pruebas de independencia. Por lo tanto, es posible que desee proceder haciendo 500 pruebas de hipótesis de independencia y reclamando la relevancia del contenido de nutrientes si al menos una de esas pruebas es positiva, es decir, ha encontrado una característica del microbioma que no es independiente del contenido de nutrientes.

El problema de este enfoque es que las pruebas de hipótesis pueden dar una falsa alarma con una probabilidad baja dada por el nivel de significación: si se utiliza una prueba de independencia con alfa igual a 0,05 (5%), entonces, esta prueba, cuando se aplica a 100 casos en los que hay independencia, afirmará sin embargo erróneamente una dependencia en 5 casos.

Así, si tiene 500 pruebas para sus 500 características del microbioma y elige para sus pruebas de hipótesis un nivel de significación de, por ejemplo, alfa igual a 0,05, encontrará unas 25 características dependientes, incluso en el caso de que el contenido de nutrientes no influya en absoluto.

Lo que hay que hacer es mitigar este efecto considerando muchas pruebas al mismo tiempo. Los posibles enfoques son, por ejemplo Corrección de Bonferroni o el Procedimiento Benjamini-Hochberg .

En pocas palabras, la corrección de Bonferroni sólo hace más difícil que una prueba individual sea positiva, mientras que el procedimiento de Benjamini-Hochberg le da la posibilidad de elegir un límite superior para el porcentaje de cuántas de sus pruebas positivas deben esperarse falsas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X