Estoy realizando una regresión lineal múltiple sobre los datos de un estudio transversal, y sospecho que existe una interacción entre mi variable dependiente (un marcador de riesgo de enfermedad) y una variable independiente (una exposición). Desde el punto de vista biológico, esto tendría sentido: el compuesto que me interesa (un tipo de retardante de llama) puede afectar a las concentraciones de colesterol en sangre, y el efecto parece ser mayor en quienes ya tienen elevados los lípidos plasmáticos.
Mis análisis iniciales utilizaron un enfoque (y: punto final - aquí colesterol, $x_1$ (exposición - retardante de la llama):
$$ y = a + \beta_1 x_1 + ... $$
Pero ahora sé que hay alguna relación $ \beta_1 \sim y $ y al estratificar por cuantiles de $y$ , $\beta_1$ cambia de aproximadamente -1 a +1 (no hay diferencias en la distribución de $x_1$ entre cuantiles). Así que en realidad el modelo debería incluir una interacción entre $x_1$ y $y$ :
$$ y = a + \beta_1 x_1 y + ... $$
¿Cuál es la forma más adecuada de abordarlo?
4 votos
Aconsejaría encarecidamente no hacer un modelo con $x_1,y$ interacción. Sería muy difícil de interpretar. ¿Qué aspecto tiene cuando se traza $x_1$ y $y$ ¿contra los demás? ¿La relación es inexistente o no es lineal?
0 votos
La relación es lineal, pero $beta$ cambia cuando estratifico por $y$ -cuantiles.
3 votos
En un modelo $y=a+\beta x_1$ sería imposible que la relación fuera lineal y que $\beta$ cambios con $y$ -cuantil. Así que el extraño patrón debe ser causado por las variables en " $\dots$ ". Tal vez la solución sea buscar interacciones entre las variables en " $\dots$ " y $x_1$ .
0 votos
$y$ es esencialmente también un marcador de salud, por lo que los que se encuentran en diferentes cuantiles tendrían una salud de base diferente. Pero no hay muchas variables disponibles que combinen el mismo tipo de información.
1 votos
Secundo el llamamiento a no utilizar $y$ como regresor. El enfoque de las variables instrumentales se utiliza a menudo cuando un determinado regresor ( $x_{1}$ en su caso) es endógena (correlacionada con el término de error). Se requiere encontrar una variable que esté correlacionada con $x_{1}$ , pero eso sólo afecta a $y$ a través de $x_{1}$ .
1 votos
Estoy de acuerdo con @svendvn tanto en a) No incluir una interacción entre $x_1$ y $y$ y en la imposibilidad de que lo que dices sea correcto - si $\beta$ cambia entonces la relación no es lineal. ¿Puedes publicar un gráfico de dispersión de $x_1$ y $y$ ? Además, ¿tiene datos en un solo punto temporal? Y, ¿puede añadir variables que sean marcadores de salud?
0 votos
Gracias - lo siento, no puedo añadir una parcela en este momento ya que no tengo conexión a Internet útil. La interacción no es lineal cuando se incluyen todos los datos, pero es sorprendentemente lineal cuando se estratifica por quintiles de y.
0 votos
He pensado en otras variables - hay varias, pero no hay un candidato obvio.