Para una enfermedad que me interesa, cinco o seis trabajos de investigación publicados han mostrado una asociación de los cambios en la expresión genética con la presencia de la enfermedad. Sin embargo, todos estos estudios de biomarcadores de diagnóstico se realizaron con un número reducido de casos (15-30) y controles (15-30), y las coincidencias entre sus listas de biomarcadores potenciales son mínimas. Los casos y los controles se definen utilizando criterios clínicamente relevantes.
Recientemente hemos completado un estudio relativamente grande y multi-institucional con 80 casos y 80 controles para investigar esto. Todas las muestras clínicas se procesaron juntas como un lote en una de las instituciones. Los análisis de nuestros datos sugieren que no hay asociación de la expresión genética con la presencia de la enfermedad. Utilizando los datos de uno de los estudios publicados que utilizó la misma tecnología de medición de la expresión génica que este estudio, para calcular el tamaño del efecto con la SSPA Paquete R basado en la estadística t moderada según el limma R, este estudio tiene una potencia de ~92% a alfa=0,10.
Los análisis que hemos realizado son:
-
agrupación jerárquica no supervisada basada en varios tipos de medidas de distancia (evaluación subjetiva)
-
análisis de componentes principales; gráficos tradicionales y matriciales (evaluación subjetiva)
-
varios tipos de pruebas de dos grupos para la expresión diferencial de los genes (umbral de significación de 0,05 para los valores P ajustados para el falso descubrimiento)
-
análisis de clasificación/predicción con validaciones cruzadas de tipo "leave-one-out" y Monte Carlo, utilizando métodos de máquinas de vectores de apoyo de núcleo lineal (SVM) y de par de puntuación superior (TSP); en el caso de la SVM, la selección de variables se basa en medidas de expresión diferencial; la TSP no requiere expresión diferencial (los índices de precisión en estos análisis se sitúan en el rango del 45%-55%)
-
confirmar la ausencia de expresión diferencial para algunos de los genes, identificados en los estudios anteriores como posibles marcadores de la enfermedad, tras cuantificar la expresión de los genes utilizando una tecnología diferente (transcripción inversa-PCR en lugar de microarrays de hibridación)
¿Son suficientes para confiar en la conclusión negativa de nuestro estudio, que las mediciones de la expresión génica no pueden utilizarse para el diagnóstico de enfermedades? ¿Hay algún otro tipo de evaluación subjetiva u objetiva del conjunto de datos de expresión que deba hacer?
Entiendo las advertencias habituales para tales conclusiones. Por ejemplo, puede haber subgrupos de casos en los que existan marcadores de la enfermedad, o que la sensibilidad o especificidad de la tecnología de medición no haya sido lo suficientemente adecuada como para que se detecten algunos genes marcadores reales.
Gracias.