Una crítica común que he escuchado en contra de los estudios de conflicto (investigaciones que examinan las causas, consecuencias y soluciones a la violencia como la guerra civil, el terrorismo, etc.) es el problema del sesgo de selección. Para calificar esto, gran parte de esta investigación consiste en muestras no aleatorias que son básicamente poblaciones enteras dentro de un marco de tiempo especificado (todos los países experimentando conflictos desde 1989-2020, por ejemplo). Dependiendo de la pregunta de investigación del autor, una muestra puede incluir 1) solo países de nivel de conflicto, 2) solo países de nivel post-conflicto, 3) tanto países de nivel de conflicto como post-conflicto, 4) díadas de nivel de conflicto (donde cada observación es un emparejamiento díadico entre dos actores armados), o, en el caso poco común, 5) todos los países, independientemente del estado de conflicto.
Después de revisar Cinelli et al. 2022, me quedé pensando en cómo se aplican los puntos de este artículo a las prácticas comunes en los estudios de conflicto. Por ejemplo, supongamos que estoy examinando el efecto de la mediación en los niveles de violencia civil (X $\rightarrow$ Y). En tales estudios, es común incluir solo países que están experimentando conflictos, ya que la mediación no ocurre en casos de no conflicto. Por lo tanto: X $\leftarrow$ Conflicto $\rightarrow$ Y ya que el Conflicto crea una oportunidad para que ocurra la mediación y para que los niveles de violencia aumenten. En este primer escenario, ¿es suficiente analizar simplemente instancias de países de nivel de conflicto? O, dado que el conflicto representa una bifurcación, ¿debería incluirse el conflicto (una dummy) directamente en un modelo como variable de control?
Además, la selección no aleatoria de solo países de nivel de conflicto se siente como sesgo de selección. Aunque, no sigue el DAG de sesgo de selección que Cinelli et al. 2022 detallan: X $\rightarrow$ Z $\leftarrow$ Y. También estoy confundido en este punto también.