Me encontré con este artículo sobre el equipo de minería de datos en la campaña de reelección de Obama. Lamentablemente, el artículo es muy confuso en cuanto a la maquinaria real de los algoritmos estadísticos. Sin embargo, parece que las técnicas generales son conocidas en las ciencias sociales y políticas. Dado que no es mi especialidad, ¿alguien puede indicarme la literatura (general) sobre este tipo de técnicas?
Respuesta
¿Demasiados anuncios?Esa área se llama microtargeting (si quieres buscarlo en Google). Las campañas son bastante reservadas en cuanto a sus herramientas y procedimientos, por lo que, hasta donde yo sé, no hay muchos trabajos publicados, salvo el de Hal Malchow Objetivo político (2008) o el de Green & Gerber (2008) Salir a votar: cómo aumentar la participación electoral (este último se ocupa más de los aspectos de las ciencias sociales, como qué anuncios son eficaces y demás).
En cuestiones más técnicas, la bibliografía es aún más escasa, pero véase, por ejemplo Murray y Scime (2010) el documento de análisis político de Imai & Strauss (2011) ( postprint ) o el reciente artículo nuestro en Annals of Applied Statistics Rusch, Lee, Hornik, Jank y Zeileis (2013) ( postprint ). Todos ellos tienen en común que utilizan técnicas de minería de datos, principalmente basadas en árboles.
Murray y Scime utilizan árboles de clasificación estándar como CART.
Rusch et al. utilizan árboles de clasificación, modelos logísticos y un híbrido de árboles y regresión logística. También utilizan (entre otros) bosques aleatorios, redes neuronales, máquinas de vectores de apoyo y árboles de regresión aditiva bayesiana para comparar con sus híbridos de árboles, como se describe en el réplica a la ponencia . Sus árboles híbridos rindieron a la par de esos otros métodos en sus conjuntos de datos y ofrecen una mayor interpretabilidad (también compartimos su código y datos).
Imai & Strauss es interesante en la medida en que presentan un marco teórico de decisión completo para la planificación óptima de campañas, y no sólo herramientas para el microtargeting como hacen los demás. Por lo tanto, se centran en aspectos de investigación operativa sobre cómo sacar el máximo partido a cada dólar invertido en la campaña. En el aspecto de su marco en el que emplean técnicas estadísticas para la microfocalización y la estimación de la participación, se basan de nuevo en los árboles de clasificación.
Por tanto, parece haber cierto consenso en que el uso de métodos basados en árboles funciona bien en este ámbito.