Tengo un gran conjunto de datos de mutaciones genéticas germinales de una población de 1,000 individuos, tanto afectados como no afectados. Ya he investigado mutaciones individuales que están enriquecidas en la población afectada. Ahora quiero determinar si la presencia de dos mutaciones en el mismo individuo es más predictiva de la enfermedad que tener cada una individualmente. Es decir, si tener tanto la mutación A como la B aumenta la probabilidad de estar afectado significativamente más que tener solo A o solo B. Quiero identificar una lista de combinaciones candidatas que muestren el mayor grado de interacción o valor predictivo.
El problema parece ser algo sencillo, pero no he podido encontrar literatura que aborde esto.
¡Gracias de antemano!