Intuitivamente entiendo el concepto de "X e Y son independientes condicionados a Z", pero no entiendo el concepto de "X e Y son dependiente condicionado a Z". ¿Puede proporcionar algunos ejemplos que muestren este caso?
Respuestas
¿Demasiados anuncios?Supongamos que tenemos el siguiente modelo estructural casual
que es el MEC del famoso problema de Monty Hall, donde
- $X$ es la puerta elegida por el jugador
- $Y$ es la puerta que esconde el coche
- $Z$ es la puerta elegida por Monty (el presentador del programa).
En este problema, hay tres puertas: $A, B$ y $C$ . Dos de estas puertas esconden una cabra y la otra un Ferrari. El objetivo del juego es, por supuesto, elegir la puerta con el Ferrari. Inicialmente, el jugador elige una puerta, $X$ , (entre tres puertas $A, B$ y $C$ ), sin abrirlo, por lo que no sabe si $X$ esconde una cabra o un Ferrari. Entonces, el anfitrión, llamado "Monty", abre otra puerta (que es diferente de $X$ ), $Z$ y muestra al jugador que la puerta contiene una cabra. El problema es: ¿debe el jugador cambiar de puerta o no? (La respuesta es "sí", pero no importa mucho para entender el concepto planteado en la pregunta).
En el MEC anterior, $U_X, U_Y$ y $U_Z$ son las variables externas (exógenas), cuyas causas no se explican. En el modelo anterior, un borde directo entre $X$ y $Z$ significa que $X$ es una causa de $Z$ . $Z$ también depende de $X$ Es decir, la puerta elegida por Monty depende de la puerta elegida por el jugador: Monty elegirá la puerta que no contenga el Ferrari. Tenga en cuenta que Monty, por supuesto, sabe lo que hay detrás de cada puerta.
En el MEC anterior, $X$ y $Y$ son dependiente con la condición de $Z$ porque, si conocemos el valor de $Z$ (es decir, la puerta elegida por Monty) y el valor de $X$ (la puerta elegida por el jugador), entonces la puerta que contiene el Ferrari depende de (o está determinada por) la puerta elegida por el jugador, es decir. $X$ .
En cierto modo, y tal vez de forma intuitiva, estamos restringiendo las posibilidades al condicionar $Z$ .
Cabe destacar que $X$ y $Y$ son dependientes condicionados a $Z$ pero no son causas la una de la otra (como muestra el MEC).
Véase también: https://en.wikipedia.org/wiki/Collider_(epidemiología) .
Dejemos que $Z$ ser de género y mitad masculina y mitad femenina, $X$ ser fumador y mitad fumador y mitad no fumador, $Y$ ser cáncer.
Para los hombres, tenemos
Cancer
Yes No total
Smoking 0.3 0.2 0.5
Non-smoking 0.2 0.3 0.5
Total 0.5 0.5 1.0
Para las mujeres, tenemos
Cancer
Yes No total
Smoking 0.2 0.3 0.5
Non-smoking 0.3 0.2 0.5
Total 0.5 0.5 1.0
Si se juntan hombre y mujer, tenemos
Cancer
Yes No total
Smoking 0.25 0.25 0.5
Non-smoking 0.25 0.25 0.5
Total 0.50 0.50 1.0
Así que "X e Y son dependientes condicionados por Z", y X e Y son independientes no condicionados por Z.
Aquí hay otro ejemplo, que se explica aquí y aparentemente fue dada por primera vez por Pearl en 1988.
Supongamos que hay dos independiente causas de que "su coche se niegue a arrancar" ( $Z$ ): "tener una batería muerta" ( $X$ ) y "no tener gas" ( $Y$ ).
Podemos modelar esto como un modelo casual:
Puedes ignorar las variables aleatorias $U_X, U_Y$ y $U_Z$ que son las variables exógenas (es decir, los "errores"). Este modelo casual es lo que se llama un " colisionador ".
Dado que las causas de $Z$ es decir $X$ ("sin batería") y $Y$ ("no tener gas"), son independiente entre sí, decirte que el coche no tiene batería no te dirá nada de que el coche tiene o no tiene gasolina. Sin embargo, si te digo que el coche no arranca y que la batería no está agotada, entonces el coche no arranca porque el depósito de gasolina debe estar vacío. En otras palabras, dos causas independientes pueden hacerse dependientes condicionando el "efecto" (es decir, un colisionador) de las dos causas. Así, si conocemos el efecto y una de las causas, entonces también conocemos la otra causa.
Para aclarar, en la práctica, "condicionar a una variable aleatoria $Z$ " significa dar información sobre la "realización" de $Z$ .
También podemos responder a esta pregunta con un enfoque ligeramente diferente. Podemos pensar en la operación de "condicionamiento" como una operación de "filtrado" en un conjunto de datos.
Supongamos que tenemos el colisionador habitual $X \rightarrow Z \leftarrow Y$ (que aparentemente es, si no la única, la situación más común en la que esto ocurre). Cuando condicionamos en $Z=z$ (es decir, cuando fijamos el valor de la variable $Z$ para ser $z$ ), limitamos nuestras comparaciones (en el conjunto de datos) a los casos en los que Z toma el valor $z$ . Pero Z depende, para su valor, de $X$ y $Y$ . Por lo tanto, si cambiamos $X$ dado que $X$ es una causa de $Z$ y dado que $Z$ es ahora una constante (es decir, no puede cambiarse), entonces, para compensar este cambio en $X$ , $Y$ también debe cambiar. Tenga en cuenta que, en general, si una causa cambia, el efecto también debe cambiar.
Por ejemplo, supongamos que $Z = X + Y$ y que $X$ y $Y$ son independientes, es decir, el valor de $X$ no depende del valor de $Y$ (y viceversa). Si $X=3$ En general, no podemos aprender nada sobre $Y$ (porque son independientes). Sin embargo, si fijo $Z=10$ (es decir, no podemos cambiar $Z$ ), entonces si cambio $X$ (por ejemplo $X=4$ ) También debo cambiar $Y$ con el fin de mantener $Z=10$ .