17 votos

Cuando es inapropiado para el control de una variable?

No puedo pensar en al menos un ingenuo ejemplo. Supongamos que queremos estudiar la relación entre X y Z. también sospecho que influencias Y Z, así que el control de Y. sin Embargo, resulta que, sin yo saberlo, X causa Y, y y causas de la a a la Z. por lo Tanto, mediante el control de Y, I "cubrir" la relación entre X y Z, puesto que X es independiente de Z dado Y.

Ahora, en el ejemplo anterior, puede darse el caso de que las relaciones que se deben estudiar son aquellos entre X y y, y y y Z. sin Embargo, si yo sabía que tales cosas a priori, yo no estaría haciendo ciencia en el primer lugar. El estudio que yo HICE, ahora sugiere que no existe relación entre X y Z, que no es el caso.... X y Z ESTÁN relacionadas.

Esto se ilustra en la siguiente dependencia en el diagrama. En el escenario adecuado, Z depende de X y y y X y y son independientes. Justamente los de control Y para determinar la relación entre X y Z. En la parte izquierda del escenario de Z depende Y que depende de X. X y Z son independientes Y dado, por lo que la relación entre X y Z es "cubierto" por el control de Y.

variable_relationships

Mi pregunta es, básicamente, "¿Cuándo es apropiado para el control de la variable y y cuando no?"... Puede ser difícil o imposible de investigar a fondo la relación entre X y y, pero, por ejemplo, controlar Y en un nivel determinado es una opción. ¿Cómo podemos decidir antes de la realización de nuestro estudio, y cuáles son los errores más comunes de controlar demasiado o demasiado poco?

Citas apreciado.

13voto

suraj Puntos 1

Creo que el rápido una frase que la respuesta a su pregunta

Cuándo es adecuado para el control de la variable y y cuando no?

es la "puerta de atrás criterio".

Judea Pearl Estructural del Modelo Causal puede decir definitivamente que las variables son suficientes (y cuando es necesario) para el acondicionamiento, para inferir el efecto causal de una variable sobre otra. Es decir, la respuesta está usando la parte de atrás de la puerta de criterio, que se describe en la página 19 de este trabajo de revisión por la Perla.

La principal limitación es que se requiere conocer la relación causal entre las variables (en forma de flechas direccionales en un gráfico). No hay forma de evitar eso. Esto es donde la dificultad y la posible subjetividad puede entrar en juego. Perla estructural del modelo causal sólo le permite saber cómo responder las preguntas correctas, dado un modelo causal (es decir, en forma de grafo dirigido), el conjunto de modelos causales son posibles dada una distribución de datos, o cómo buscar causal de la estructura mediante la realización de la derecha experimento. No nos dice cómo encontrar la estructura causal dado sólo la distribución de los datos. De hecho, afirma que esto es imposible sin el uso de conocimiento externo/intuición sobre el significado de las variables.

La parte de atrás de la puerta de los criterios puede ser enunciada de la siguiente manera:

Para encontrar el efecto causal de $X$ $Y,$ un conjunto de variables de los nodos de $S$ es suficiente para estar condicionado por el tiempo que satisfaga a ambos de los siguientes criterios:

1) No hay elementos en $S$ es un descendiente de $X$

2) $S$ bloques de todos "por la puerta de atrás" caminos entre el $X$ $Y$

Aquí, una "puerta trasera" ruta de acceso es simplemente un camino de flechas que comienzan a $Y$ y terminar con una flecha apuntando a $X.$ (la dirección en La que todas las otras flechas punto no es importante.) Y el "bloqueo" es, en sí misma, un criterio que tiene un significado específico, que se da en la página 11 del enlace de arriba. Este es el mismo criterio que usted pueda leer para aprender "D-separación". Yo he encontrado que el capítulo 8 de la del Obispo de Reconocimiento de patrones y Aprendizaje de Máquina describe el concepto de bloqueo de D-separación mucho mejor que la Perla de origen he enlazado más arriba. Pero va como esto:

Un conjunto de nodos, $S,$ bloques de un camino entre el $X$ $Y$ si se cumple al menos uno de los siguientes criterios:

1) Uno de los nodos en el camino, que también se encuentra en $S,$ emite al menos una flecha en el camino (es decir, la flecha está apuntando lejos del nodo)

2) Un nodo que no está ni en el $S$ ni un antepasado de un nodo en $S$ tiene dos flechas en el camino de la "colisión" hacia ella (es decir, la reunión de la cabeza-a-cabeza)

Este es un o de criterio, a diferencia de la general por la puerta de atrás criterio de que es una y criterio.

Para ser claros acerca de la parte de atrás de la puerta de criterio, lo que usted dice es que, para un determinado modelo causal, cuando acondicionado en una suficiente variable, usted puede aprender la causal del impacto de la distribución de probabilidad de los datos. (Como sabemos, la distribución conjunta por sí sola no es suficiente para encontrar conducta causal debido a que varias causales de las estructuras pueden ser responsables de la misma distribución. Esta es la razón por la causal del modelo es necesario). La distribución puede ser estimada a partir de ordinario estadística/los métodos de aprendizaje automático de los datos de observación. Así que, mientras usted sabe que la estructura causal permite acondicionado en una variable (o conjunto de variables), su estimación del efecto causal de una variable sobre otra es tan buena como la de su estimación de la distribución de los datos, que puede obtener a través de métodos estadísticos.

Aquí es lo que nos encontramos cuando aplicamos la puerta trasera con criterio a sus dos diagramas:

En ninguno de los casos existe una puerta trasera para el camino de $Z$ $X.$Así que es verdad que $Y$ bloques de "todos" por la puerta de atrás caminos, porque no hay ninguna. Sin embargo, en la parte izquierda del diagrama, $Y$ es un descendiente directo de $X,$, mientras que en el diagrama derecho no lo es. Por lo tanto, $Y$ sigue la parte de atrás de la puerta de criterio en el diagrama derecho, pero no la izquierda. Estos no son sorprendentes resultados.

Lo que es sorprendente, sin embargo, es que en el diagrama derecho, como el tiempo es la imagen completa, no es necesario que en la condición de $Y$ para obtener el máximo efecto causal de $X$$Z$. (Dicho de otra manera, el nulo conjunto satisface la parte de atrás de la puerta de los criterios, y, por tanto, suficiente para el acondicionamiento.) Intuitivamente esto es cierto debido a que el valor de $X$ no está asociado con el de $Y$ lo suficiente de datos, usted puede simplemente promedio de los valores de $Y$ a marginar el efecto de la $Y$ $Z.$ Una objeción a este punto puede ser que los datos son limitados, por lo que no tiene una distribución representativa de $Y$ valores. Pero recordemos que la puerta de atrás criterio se supone que tiene la distribución de probabilidad de los datos. En el caso de que usted puede analíticamente marginar $Y.$ Marginación más de un determinado conjunto de datos es sólo una estimación. También, tenga en cuenta que es altamente improbable que esta es la imagen completa. Es probable que los factores externos que afectan $X.$ Si esos factores también están asociados con $Y$ en cualquier forma, se debe trabajar más para ver si $Y$ debe estar condicionada, o si es suficiente. Si usted sacar otra flecha que apunta desde $Y$ $X$ $Y$hace necesario el control.

Esos son, por supuesto, ejemplos muy simples donde la intuición es suficiente para saber cuándo $Y$ puede o no puede ser controlada. Pero he aquí un par de ejemplos más donde no es evidente observando el diagrama, y usted puede utilizar la parte de atrás de la puerta de los criterios. Para el siguiente diagrama nos preguntamos si es suficiente para el control de la $Y$ al determinar el efecto causal de $X$ $Z.$

Is it sufficient to control for $Y$ to find the causal impact of $X$ on $Z$?

La primera cosa a tener en cuenta es que, en ambos casos, $Y$ no es un descendiente de $X.$, por Lo que pasa a ese criterio. La siguiente cosa a tener en cuenta es que, en ambos casos, hay varios backdoor rutas de $Z$ $X.$Dos en el diagrama izquierdo y tres en el derecho.

En el diagrama de la izquierda de la puerta trasera caminos se $Z \leftarrow Y \rightarrow X$ y $Z \leftarrow W \rightarrow B \leftarrow A \rightarrow X. \hspace{1mm}$ $Y$ los bloques de la primera ruta porque es una flecha de emisión de nodo que se encuentra directamente en el camino. $Y$ también bloquea el segundo camino, porque no es ni $B,$ ni es un descendiente de $B,$ que es la única flecha que chocan nodo en el camino. Por lo tanto, $Y$ es un conjunto suficiente para el acondicionamiento. (Tenga en cuenta que, a diferencia de su derecho diagrama, el valor null no es suficiente para el acondicionamiento, porque no bloquear el camino de $Z \leftarrow Y \rightarrow X$.)

En el diagrama derecho de la puerta trasera rutas de acceso son los mismos dos como en la izquierda, además de la ruta de acceso $Z \leftarrow W \rightarrow B \rightarrow Y \rightarrow X. \hspace{1mm}$ $Y$ no bloquear este camino, porque es una flecha de emisión de nodo en el camino. También bloquea el camino de $Z \leftarrow Y \rightarrow X$ por la misma razón que el diagrama de la izquierda. Sin embargo, no bloquear el camino de $Z \leftarrow W \rightarrow B \leftarrow A \rightarrow X,$ porque es un descendiente directo del colisionador nodo $B.$ por lo Tanto es no suficiente para el acondicionamiento.

Es bastante intuitivo para ver por qué $Y$ es suficiente para el acondicionamiento de la izquierda del diagrama, debido a las variables exógenas $A$ $W$ que afectan $X$ $Z$ respectivamente. Sin embargo, supongamos que no fue no $B.$ En ese caso, no habría espurias relación entre el $X$ $Z$ debido a estas variables exógenas así que no son motivo de preocupación. La existencia de $B,$ sin embargo, pone en cuestión. Si $B$ se le permite tomar cualquier valor en que, naturalmente, lleva a dado $A$$W$, no sería un problema porque no tiene ningún impacto sobre las variables más importantes, o las variables exógenas en su determinación. Sin embargo, si $B$ (o cualquiera de sus descendientes) es controlada , a continuación, lo que realmente hace $A$ $W$ dependiente, lo cual crea la falsa relación entre la $X$ $Z$ que no queremos. Como se mencionó en el origen vinculado, este es un ejemplo de Berkson la paradoja, donde una observación de una variable causada por dos fuentes independientes, hace que esas fuentes dependiente (por ejemplo, el resultado de dos independientes coin flips se representa depende de la observación del número total de cabezas volteadas).

Como he mencionado antes, el uso de la puerta de atrás criterio requiere que usted conozca el modelo causal (es decir, la "correcta" diagrama de flechas entre las variables). Pero la estructura Causal del Modelo, en mi opinión, también le ofrece la mejor y de manera más formal a la búsqueda de un modelo, o a saber cuando la búsqueda es inútil. También tiene el maravilloso efecto secundario de la representación de los términos como "confusión", "mediación", y "falso" (todos de que me confundan) obsoleto. Solo me muestre la imagen y te diré que los círculos deben ser controlados.

10voto

GenericTypeTea Puntos 27689

Acondicionado (es decir, ajustar) las probabilidades de que algunos de los resultados dado algunos predictor en la tercera de las variables se practica ampliamente, pero, como señalan acertadamente, en realidad puede introducir un sesgo en la estimación resultante como una representación de los efectos causales. Esto puede ocurrir incluso con la "clásica" de las definiciones de un potencial causal factor de confusión, debido a que tanto el factor de confusión en sí, y el predictor de interés pueden tener más causales de los factores de confusión aguas arriba. En el DAG abajo, por ejemplo, $L$ es un clásico factor de confusión del efecto causal de $E$$D$, debido a que (1) las causas y por lo tanto se asocia con $E$, y (2) se asocia con $D$ ya que está asociada con $U_{2}$, lo que se asocia con $D$. Sin embargo, bien acondicionado o la estratificación $P(D|E)$ $L$ ("collider") producirá sesgada causal estimaciones del efecto de la $E$ $D$ porque $L$ es confundido con $D$ por el no de la variable $U_{2}$, e $L$ es confundido con $E$ por el no de la variable $U_{1}$.

DAG

La comprensión de que las variables de condición o estratificar el análisis de proporcionar una evaluación imparcial y causal estimación requiere una cuidadosa consideración de la posible Dag utilizando el mismo criterio que para el efecto causal identificabilidad-ninguna de las causas comunes que no son bloqueados por la puerta trasera de las vías descritas por la Perla, Petirrojos, y otros. No hay atajos. Aprender común patrones de confusión. Aprender común el sesgo de selección de patrones. En la práctica.

Referencias

Groenlandia, S., Perla, J., y Robins, J. M. (1999). Causal diagramas para la investigación epidemiológica. Epidemiología, 10(1):37-48.

Hernán, M. A. y Robins, J. M. (2018). La Inferencia Causal. Chapman & Hall/CRC, Boca Raton, FL

Maldonado, G. y Groenlandia, S. (2002). La estimación de efectos causales. Revista internacional de Epidemiología, 31(2):422-438.

Perla, J. (2000). Causalidad: Modelos, el Razonamiento y la Inferencia. Cambridge University Press.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X