Tengo un conjunto de datos que incluye una variable independiente dicotómica principal (por ejemplo, fumar), una variable dependiente dicotómica principal (por ejemplo, dolor crónico de espalda) y varios covariables (por ejemplo, diagnóstico de varios trastornos mentales, edad, sexo). He calculado los puntajes de propensión para fumar utilizando los covariables de interés. Como resultado, se me proporciona un archivo de datos que incluye solo a individuos que han sido emparejados. Digamos que tengo 1000 fumadores y 1000 no fumadores, con ambos grupos emparejados en los covariables. Tenga en cuenta que con "emparejados" me refiero a que las dos muestras comparten medias similares en los covariables, no que los fumadores se emparejen con no fumadores con puntajes de propensión similares.
Estoy interesado en ver si los individuos que fuman tienen más probabilidades de tener dolor crónico en esta muestra emparejada en los covariables de interés. Para hacer esto, típicamente cruzaría tabulaciones entre fumar/no fumar y dolor/no dolor y calcularía las razones de disparidad.
¿Sigue siendo apropiado calcular las razones de disparidad después de que una muestra esté emparejada en puntajes de propensión basados en covariables?
¿Cambiar el número de participantes en el grupo de control crea algún problema? Por ejemplo, podría tener 1000 fumadores y 4000 no fumadores y calcular las razones de disparidad utilizando estos números.
mi intuición me dice que esto está bien, pero quiero asegurarme ya que nunca lo he visto hacer.