Si quieres tener al menos un número definido de predictores con algún rango de valores definidos por la literatura, ¿por qué elegir el enfoque de LASSO puro para empezar? Como @probabilityislogic sugirió, deberías usar algunos antecedentes informativos sobre aquellas variables de las que tienes algún conocimiento. Si quieres retener algunas de las propiedades de LASSO para el resto de los predictores, quizás podrías usar un prior con una distribución exponencial doble para cada una de las otras entradas, es decir, usar una densidad de la forma $$p( \beta_i )= \frac { \lambda }{2} \text {exp} \left (- \lambda | \beta_i | \right ),$$ donde $ \lambda $ es el multiplicador de lagrange correspondiente a la solución de LASSO pura. Esta última afirmación proviene del hecho de que, en ausencia de las variables con los priores informativos, esta es otra forma de derivar el LASSO (maximizando el modo posterior dado los supuestos de normalidad para los residuos).