Una forma de reformular el problema es la siguiente: se quiere seleccionar un pequeño conjunto de características que predigan bien la puntuación de fidelidad, utilizando un modelo lineal, por ejemplo. Este problema se denomina selección del (mejor) subconjunto.
Supongamos que quiere elegir k características. La primera forma de hacerlo es probar todos los subconjuntos de k características, haciendo una regresión lineal en cada subconjunto. Pero para un conjunto de datos grande, esto es demasiado largo.
Otra forma de hacerlo es de forma codiciosa. Se empieza eligiendo la característica más correlacionada con la puntuación y se añade al subconjunto (vacío). Se calcula el modelo lineal asociado a este subconjunto (en este caso, sólo un coeficiente) para predecir la puntuación de fidelidad. A continuación, elija la característica que esté más correlacionada con el residuo (la diferencia entre el valor predicho por su modelo lineal y la puntuación real) y calcule el modelo lineal correspondiente a su nuevo subconjunto. Y así sucesivamente, hasta que tenga k características en su conjunto.
Hay otros métodos, como el lazo, para hacer la selección de subconjuntos. Para una introducción más completa a la selección de subconjuntos, debería leer la sección 3.3 de Los elementos del aprendizaje estadístico que se puede descargar gratuitamente en el sitio de los autores.