60 votos

Pregunta de la entrevista: Si la correlación no implica #39 causa, ¿cómo detecta la causalidad?

Tengo esta pregunta:

Si la correlación no implica causalidad, ¿cómo se detecta la causalidad?

en una entrevista.

Mi respuesta fue: Usted hace alguna forma de prueba A / B. No conseguimos encontrar tu ubicación exacta.

¿Hay otros enfoques? ¿Y mi respuesta fue correcta?

43voto

Marco Marsala Puntos 11

Hay un par de maneras de evitar esto. Tienes razón en que las pruebas a/B es uno de estos. El premio Nobel de economía de este año fue otorgado por el pionero de experimentos de campo en el estudio de las políticas contra la pobreza que hacer exactamente esto.

De lo contrario, se podría ir sobre una de las siguientes alternativas:

  1. Selección en observables. Probablemente el más popular de enfoque. Se asume que el condicional en algunas variables de control, tratamiento de la asignación es aleatoria. En lo que se denomina el potencial del marco de resultados, bajo un binario de tratamiento que podrían estado esta suposición como Yi(1),Yi(0)TiXi donde Ti{0,1}, Yi(t) son de la unidad de i's resultado bajo la condición del tratamiento t, e Xi es un vector de i's características. La forma ideal para lograr esto es aleatorizar Ti. Pero otros enfoques que se basan en este supuesto son coincidentes (incluyendo ML de métodos tales como causal de árboles), y la inversa de la probabilidad de ponderación, y el más ubicuo método de adición de Xi como covariables adicionales en una regresión lineal. Ciencias de la computación nos ha regalado con la teoría de la "dirigido acíclico gráficos" para la inferencia causal que nos ayudan a reflexionar acerca de cuáles son buenos y cuáles son malos variables a incluir en Xi.
  2. De discontinuidad en la regresión diseños. Este método es muy popular porque ofrece creíble la interpretación de los resultados como causal. Para ilustrar la idea, tomemos el ejemplo de una discontinuidad espacial. Supongamos que hubo un terremoto y de los niños en una determinada zona recibieron el mandato de no ir a la escuela por 3 meses. Los niños fuera de la frontera había ningún problema en ir a la escuela. Así que usted puede comparar los niños dentro de la zona para aquellos que sólo fuera de, y posiblemente la única cosa que va a ser diferente entre ellos es la asistencia a la escuela. Usted puede, a continuación, la regresión en sus siguientes años de la escolaridad, la asistencia a la universidad, etc., en que lado de la frontera vivieron, y obtener los efectos causales de la asistencia a la escuela. Tenga en cuenta que ¿cómo elegir el derecho de la ventana alrededor de la discontinuidad y de aplicar el RD estimador es una sutil pregunta y hay una literatura detrás de este (ver @olooney comentario a esta respuesta).
  3. Variables instrumentales. Esto es similar a la de discontinuidad en la regresión, pero por lo general mucho más difícil de defender. Un instrumento es una variable que usted cree que es sólo se correlacionó con el resultado a través de la condición del tratamiento (es decir, a través de la variable cuyo efecto se desea medir). Si este es el caso, usted puede utilizar algo llamado mínimos cuadrados en dos etapas para estimar el efecto causal. Este género tiene una pequeña biblioteca de la pena de investigación sobre cómo las cosas pueden ir mal si los supuestos fallar, e incluso si lo hacen no fallar. Pero tenga en cuenta que un RD puede ser un instrumento válido. En el terremoto ejemplo, de qué lado de la frontera alguien vivía en puede ser un instrumento para la asistencia a la escuela porque es factible que no se correlaciona con algo que explica los resultados. Otras inteligente estrategias en esta categoría de shift-share y Bartik instrumentos. Estos también tienen la investigación explora los supuestos de los que dependen.
  4. La diferencia-en-diferencias. Este método se relaja el supuesto de selección en observables. Se mueve a un antes-después de la creación, y compara el resultado medio del cambio de aquellos en el grupo de tratamiento a la media del resultado de cambio de aquellos en el grupo de control. Al hacerlo, la suposición que se hace es que en el de paralelo tendencias:la de que el cambio promedio del grupo de tratamiento hubiera sido el mismo que el del grupo de control no se habían recibido el tratamiento. Este método es muy popular porque es más robusto que el de la selección en observables y configuración donde puede ser creíble que se aplican son más omnipresente que para discontinuidad en la regresión o variables instrumentales. Un ejemplo famoso es el salario mínimo estudio de Card y Krueger que en comparación con el restaurante de comida rápida de los trabajadores en el área de Filadelfia, antes y después de un salario mínimo cambio. Una relativamente reciente variante de este método es que de sintético de los controles que construye un control artificial de grupo y no diff-en-diff, que puede o no como para su credibilidad.

15voto

Sammy Puntos 119

Me gustaría darle una filosófica y científica de la respuesta:

En teoría y en principio, la causalidad no puede ser observado. Nunca lo ha hecho y nunca lo hará. Tomemos un ejemplo sencillo: cuando se pulsa el botón de tu teclado y las letras aparecen en la pantalla, mientras que escribir un post en este sitio web, usted asume un efecto causal. En primer lugar, porque usted observar la correlación entre usted de golpear las teclas y letras que aparecen en su pantalla. Y en segundo lugar, porque tiene un modelo de causalidad de lo que está sucediendo en su mente que usted encuentra plausible (que es, básicamente, que el teclado es un dispositivo de entrada usado para escribir).

Sin embargo, ninguno de los dos son de la causalidad y usted no puede observar la causalidad. Podría ser que un demonio invisible crea las letras en la pantalla cada vez que se pulsen las teclas. Que es el punto de vista filosófico y respuesta.

La respuesta científica es observar la causalidad: que necesitas para manipular la entrada de datos, el control de todo lo demás y observar el efecto. Ya no eres un psicólogo el diseño de un estudio, pero el análisis de los datos, que significa que usted necesita tener los datos en el tiempo.

Así, por ejemplo, si su suposición es que al vivir en una ciudad poblada aumenta el riesgo de padecer de depresión clínica: entonces usted va a necesitar una muestra de personas que viven en una gran ciudad que más tarde se desarrolló la depresión clínica. Y no sólo una correlación positiva entre la variable "no vivo en una gran ciudad" y "sufre de depresión clínica". Y usted también tendrá que controlar por otras variables independientes.

Otra forma de lograr esto sería en un entorno de laboratorio donde se puede manipular explícitamente las variables (y es mucho más fácil de controlar por otras variables independientes). Este enfoque, sin embargo, no se relacionan tanto con los datos de la ciencia.

9voto

John Darson Puntos 36

Brevemente...

Opción 1:

Ensayo Controlado Aleatorizado. El 'estándar de oro'.

Opción 2:

  1. Dibuje un diagrama causal de su sistema. Un gráfico acíclico dirigido de cómo usted y otros piensan que el sistema funciona.
  2. Decidir si se puede deducir de la relación de causalidad a partir de un estudio observacional, por el puerta de atrás criterio, frente a la puerta de criterio, o a otras independencia condicional métodos. Recopilar datos sobre las variables relevantes. Ver Judea Pearl.
  3. Construir el modelo estadístico con 1 & 2.
  4. Tred con precaución, ya que su DAG, modelo estadístico, ni sus datos son perfecto.

Para una introducción a ver la Perla El Libro de los por Qué

6voto

Okiuh Puntos 6

No estoy seguro de que esto agregue nada, pero si necesitas otro pensamiento de la filosofía, en la época, (1960s) nos enseñaron en una clase de filosofía que los 3 criterios de causalidad de Hume requerían: (1) precedencia temporal (presunta causa anterior en el tiempo); 2) una correlación empírica observable; Y (3) que todas las hipótesis rivales habían sido descartadas.

Suponiendo que los criterios #3 sean prácticamente imposibles, seguiría la causalidad será para siempre imposible de demostrar.

1voto

TDT Puntos 21

En resumen, para detectar la relación de causalidad directa, tenemos que controlar para todo lo demás. Por ejemplo, plantar dos árboles usando el mismo suelo, la misma cantidad de agua, al mismo tiempo bajo la luz, y así sucesivamente, pero con dos diferentes fertilizantes. Si todo es igual, y el árbol está creciendo más rápido, entonces podemos decir que el abono para los árboles a causa de un desarrollo más rápido.

Podemos hacer ese tipo de conclusión, solo estamos suponiendo que todo lo demás es el mismo. Esto puede ser difícil de comprobar, de manera que en la práctica es una suposición. Por ejemplo, dos árboles pueden tener diferentes genes y un gen causante de más rápido desarrollo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X