Estoy tratando de entender un artículo académico que estoy leyendo sobre bolsas de regresión logística para la comercialización de atribución -- http://www.turn.com.akadns.net/sites/default/files/whitepapers/TURN_Tech_WP_Data-driven_Multi-touch_Attribution_Models.pdf
En particular, este párrafo:
Paso 1. Para un determinado conjunto de datos, muestra una proporción (ps) de todos los observaciones de la muestra y una proporción (pc) de todas las covariables. Ajuste un modelo de regresión logística en la muestra de las covariables y la datos de muestreo. Registro de los coeficientes estimados -- recomendamos escoger ps y pc tomar los valores de alrededor de 0.5 si tanto la variabilidad y la exactitud son de la preocupación
Por favor alguien puede explicar qué significa esto en la (esperemos) la llanura inglés? Basado en mi entendimiento, la idea es seguir ejecutando la regresión logística en .5 azar subconjuntos de los datos de ejemplo y, a continuación, el promedio de todo el registro que se impar coeficientes que cumplir un .5 selección de umbral?
Completamente puntos de Bonificación Opcional 1: En una nota de lado, es que esta aplicación similar a la idea de aleatorizado de regresión logística en scikit para aprender python? Si no, ¿cuál es la diferencia? http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.RandomizedLogisticRegression.html
Completamente puntos de Bonificación Opcional 2: ¿hay una manera de incorporar ordenó efectos en bolsas modelo de regresión logística (por ejemplo, el orden en que las variables predictoras, en este caso los anuncios, apareció -- sin embargo, esto es de secundaria preocupación a la pregunta principal)