El objetivo principal de mi trabajo es discriminar a los pacientes frente a los controles sanos utilizando fMRI y análisis de patrones multivariados (MVPA). Como quiero clasificar a nivel de sujeto, realicé un GLM de sujeto separado para obtener las estimaciones de los parámetros para cada condición de tarea. Luego transformé las estimaciones beta en valores t para mejorar la relación señal/ruido. Tengo 31 controles y 32 pacientes. Todos ellos completaron 3 carreras, excepto 4 pacientes que sólo completaron 2 carreras debido a la fatiga.
Mi pregunta es: dado que el MVPA es muy sensible a las clases desiguales, ¿debería excluir a los 4 pacientes que sólo completaron 2 carreras y luego equilibrar las clases haciendo algún tipo de submuestreo de la clase de controles, por ejemplo? Mi principal preocupación es que esos 4 pacientes tienen una menor relación señal/ruido en comparación con los otros que completaron 3 carreras, lo que podría socavar la precisión de la clasificación.
He buscado en varios artículos y en algunos libros de texto, pero no encuentro nada sobre recorridos desiguales en el análisis de clasificación entre sujetos. Agradecería que alguien compartiera algunas referencias sobre este tema.