6 votos

Agregar datos multidimensional al modelo de Cox mutivariate

Tengo una supervivencia del cáncer de ensayos clínicos conjunto de datos del que me han generado modelos de Cox mediante adelante cociente de probabilidad de pruebas dentro de R. Estos modelos se basan en 'tradicional' de cáncer de variables (por ejemplo. la edad, la histología, la metástasis, etc).

Me gustaría extender el modelo de uso de alta de datos dimensional (donde hemos medido muchos miles de genes, por lo que vale, esta es la metilación del ADN de datos, que puede variar de cero a uno, en lugar de la expresión génica). Varios métodos han sido propuestos para la investigación de la supervivencia con datos de alta dimensión, pero yo no soy consciente de que cualquier enfoques que se adapta a mis necesidades, es decir la adición de datos de alta dimensión a una base multi-variable modelo construido utilizando previamente identificados supervivencia se correlaciona.

Como un primer paso, yo estoy probando para el bi-modalidad y la reducción de la dimensionalidad mediante la selección de la mayoría de los bi-modal sondas para su posterior análisis. Estas sondas sería el más susceptible de prueba y verificación en el laboratorio.

Un enfoque podría ser simplemente para continuar con el avance LR pruebas, aunque esto me dejarían muy propenso a sobreajuste.

Otro (más sensato, en mi opinión) enfoque sería agregado colecciones de genes en (relacionados con la supervivencia) metagenes y, a continuación, recortar el metagenes en un puñado de comprobables genes, por lo que este podría ser un útil probar clínicamente, aunque esto también puede ser propenso a un sobreajuste.

El cáncer de mi trabajo consiste en raras y prueba/entrenamiento de cohortes son difíciles. Para poner las cosas en perspectiva, los ensayos clínicos conjunto de datos es de 135 casos, con un 55 emparejados por edad no clínicos de los ensayos de los casos, que no muestran ninguna diferencia en la supervivencia de los ensayos clínicos conjunto de datos.

Así que mi pregunta es, ¿qué tipo de enfoques debería considerar y es lo que he hecho hasta ahora sensato?

La orientación de este lugar laberíntico, la pregunta es la más apreciada.

Gracias por leer!

Ed

1voto

pirho Puntos 1387

Un enfoque sería simplemente llevar a cabo con la prueba de LR hacia adelante, aunque esto me dejaría muy propensos al desbordamiento.

Podría penalizar complejidad del modelo para evitar desbordamiento. Mi favorito es el stepAIC de la función de la MASS paquete que utiliza AIC (puede configurarse para utilizar BIC) como una bondad de ajuste.

0voto

pirho Puntos 1387

Edit: después del comentario debajo de EdS mi respuesta original no fue significativo más. ¡@EdS, gracias por la informacion adicional!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X