Digamos que tengo una población total de N=100. El Algoritmo #1 se basa en algunos predictores y selecciona n1=10 sujetos (es decir, subgrupo #1). El Algoritmo #2 se basa en otro conjunto de predictores y selecciona n2=50 sujetos (es decir, subgrupo #2) de la misma población original (N=100).
Algunos de estos sujetos seleccionados aparecen dos veces en ambos subgrupos derivados de los Algoritmos #1 y #2, mientras que cada subgrupo también tiene sus propios sujetos únicos.
Ahora, cada subgrupo tiene una edad promedio, ¿es correcto usar la prueba t pareada para probar la diferencia estadística? ¿O debería usar una prueba diferente?
//////////////////////////////////////
Ediciones:
Lo que quiero probar es si la media de edad del subgrupo #1 es estadísticamente diferente (con un p=0.05) que la media de edad del subgrupo #2 (considerando el hecho de que algunos sujetos aparecen en ambos subgrupos, mientras que otros solo aparecen en uno u otro subgrupo #1 o subgrupo #2).