1 votos

¿Si varias variables suman 1, son independientes entre sí?

Estoy tratando de probar la asociación entre fracciones continuas de tipos de células en una muestra (por ejemplo, células inmunes, células cancerosas, fibroblastos...) y grado tumoral (categórico/binario/ordinal, grado 1 o 2). Las fracciones de células siempre suman 1, porque en conjunto las fracciones de células representan el 100% de la muestra.

Muchos tests estadísticos asumen independencia pero no puedo encontrar una definición útil de independencia en este contexto. Como ejemplo, digamos que las muestras 1 y 2 tienen fracciones A, B y C... un aumento en la fracción A en la muestra 1 tendría que resultar en una disminución en las fracciones B o C o ambas, también en la muestra 1. Esto sugiere falta de independencia. Sin embargo, las fracciones en la muestra 1 no tienen impacto en la muestra 2... ¿son entonces las variables de fracción independientes?

También estoy perdido respecto a cómo probar la asociación entre múltiples variables continuas no distribuidas normalmente, (quizás no independientes), en una variable de resultado binaria. Hay pruebas que cumplen algunas de estas suposiciones pero no puedo encontrar una que cumpla todas.

Cualquier ayuda es muy apreciada, ¡gracias!

0voto

EdM Puntos 5716

Si tienes $k$ tipos de células diferentes, entonces tienes $k-1$ fracciones de tipos de células linealmente independientes dentro de cada muestra. Esta es una situación estándar cuando tienes múltiples categorías mutuamente excluyentes para una variable. Este es un tipo de datos composicionales, que podría ser una mejor elección para uno de tus tags. Si las observaciones entre muestras son independientes o no, depende del diseño del estudio.

Si intentas incluir todas las proporciones de tipos de células como predictores, ese conjunto de predictores será linealmente dependiente y el software o bien se negará a ajustar el modelo o (quizás silenciosamente) eliminará uno de todos modos. Por lo tanto, es mejor elegir uno para omitir tú mismo, quizás el que menos probable sea que difiera entre muestras. (No es necesario que los predictores tengan una distribución particular, normal o de otro tipo).

Aunque estás pensando en los tipos de células como predictores y el grado de tumor como el desenlace, podrías equivalentemente invertir esto con el grado de tumor como predictor y las proporciones de tipos de células como desenlaces. En mi opinión, biológicamente eso tal vez tenga aún más sentido.

Con las fracciones de tipos de células como desenlaces, podrías evaluar las logaritmos de probabilidades de tipos de células en comparación con un tipo de célula de referencia con regresión logística multinomial. Modelas los números reales en cada clase de tipo de célula, como se ilustra en el enlace anterior, ya que la varianza de una estimación de proporción depende del número de observaciones.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X