34 votos

Si la correlación no implica causalidad", entonces si encontramos una correlación estadísticamente significativa, cómo puedo probar la relación de causalidad?

Entiendo que correlación no es causalidad. Supongamos que tenemos una alta correlación entre dos variables. ¿Cómo se puede comprobar si esta correlación es en realidad debido a la relación de causalidad? O, ¿bajo qué condiciones, exactamente, podemos utilizar los datos experimentales para deducir una relación causal entre dos o más variables?

16voto

wtfsven Puntos 133

Un muy probable razón de 2 variables que se correlacionaron es que sus cambios están ligados a una tercera variable. Otras razones son la oportunidad (si prueba suficiente de la no-correlación de las variables de correlación, algunos se muestran correlación), o muy complejos mecanismos que implican varios pasos.

Ver http://tylervigen.com/ por ejemplos como este:

enter image description here

Para afirmar la causalidad de A -> B, usted necesita un experimento donde se puede controlar Una variable y no la influencia de las otras variables. A continuación, medir, si la correlación de a y B que todavía existe si cambia la variable.

Para casi todas las aplicaciones prácticas, es casi no es posible para no influir en los demás (frecuencia desconocida) variables, y, por lo tanto lo mejor que podemos hacer es demostrar la ausencia de causalidad.

Para poder afirmar una relación causal, se comienza con la hipótesis de que las 2 variables tienen una relación causal, utilice un experimento para refutar la hipótesis y, si no, se puede afirmar, con un grado de certeza de que la hipótesis es verdadera. Qué tan alto el grado de certeza dependerá de su campo de investigación.

En muchos campos es común o necesarios para el funcionamiento de 2 piezas de su experimento en paralelo, uno en el que la variable a es cambiado, y un grupo de control donde la variable no cambia, pero el experimento por lo demás es exactamente la misma - por ejemplo, en el caso de la medicina que se adhiera a los sujetos con una aguja o hacerlos tragar píldoras. Si el experimento muestra la correlación entre a y B, pero no entre a y B' (B, del grupo de control), puede asumir la relación de causalidad.

También hay otras maneras de celebrar la causalidad, si un experimento no es posible, o aconsejable, por diversas razones (la moral, la ética, PR, costo, tiempo). Una forma común es el uso de la deducción. Tomando un ejemplo de un comentario: para demostrar que el fumar causa cáncer en los seres humanos, podemos utilizar un experimento para demostrar que fumar causa cáncer en ratones, luego de probar que existe una correlación entre fumar y el cáncer en los seres humanos, y deducir que por lo tanto es muy probable que el fumar causa cáncer en los seres humanos - esta prueba puede ser reforzada si, también refutar que las causas de cáncer de fumar. Otra forma de conclusión de la causalidad es la exclusión de otras causas de la correlación, dejando a la causalidad como la mejor restantes explicación de la correlación de este método no siempre es aplicable, porque a veces es imposible eliminar todas las posibles causas de la correlación (llamado "la puerta de atrás de rutas" en otra respuesta). En el número de fumadores/cáncer de ejemplo, podríamos usar este método para demostrar que el tabaco es responsable de alquitrán en los pulmones, debido a que no hay muchas fuentes posibles para que.

Estas otras formas de "probar" la causalidad no siempre son ideales desde un punto de vista científico, porque no son tan concluyentes como un simple experimento. El calentamiento global, el debate es un gran ejemplo para mostrar cómo es mucho más fácil despedir a la causalidad de la que aún no se ha probado de manera concluyente con un experimento repetible.

Para comic relief, he aquí un ejemplo de un experimento que técnicamente es plausible, pero no es aconsejable, debido a la no-razones científicas (la moral, la ética, PR, costo):

Image taken from phroyd.tumblr.com

10voto

Ash Puntos 117

Independientemente de si el diseño es experimental o de observación, una asociación entre una variable y un resultado Y refleja una relación causal entre Una y y si no hay ninguna puerta trasera abierta caminos entre Una y Y.

En un diseño experimental, esto es más fácil de lograr por la aleatorización de la exposición o el tratamiento asignado. Salvo ideal de la aleatorización, la libertad de asociación el efecto del tratamiento es una estimación insesgada de la causal del efecto del tratamiento bajo los supuestos de la intercambiabilidad (tratamiento de asignación es independiente de la hipótesis los resultados), la positividad, etc...

Referencias

Hernan, Petirrojos. La Inferencia Causal
Pearl. La Inferencia Causal en la Estadística: Una Visión general

PS Usted puede buscar en google para la Inferencia Causal y los siguientes nombres (para empezar) para obtener más información sobre el tema: Judea Pearl, Donald Rubin, Miguil Hernán.

5voto

Karl Puntos 162

Echa un vistazo aquí:

http://en.wikipedia.org/wiki/Correlation_does_not_imply_causation

Contradigo @Ashs declaración: Independientemente de si el diseño es experimental o de observación, una asociación entre una variable y un resultado Y refleja una relación causal entre Una y y si no hay ninguna puerta trasera abierta caminos entre Una y Y.

Por ejemplo, Un helado de ventas, Y las muertes en piscinas; ambos están correlacionados, pero la causa para aumentar o disminuir la temperatura. Tal vez @Ceniza significa con la puerta trasera abierta rutas tanto en función de una tercera variable, pero entonces su formulación es para mí muy claro.

3voto

Considere la posibilidad de un aumento en la tasa de divorcio, se correlaciona con un aumento en abogado de los ingresos.

Intuitivamente parece obvio que estas métricas deben ser correlacionados. Más parejas (demanda) de archivos para obtener más divorcios, por lo que más abogados (suministro) de aumentar sus precios.

Parece que un aumento en la tasa de divorcio provoca un aumento en el abogado de los ingresos, debido a que el exceso de la demanda de las parejas causado a los abogados a subir sus precios.

O, es que al revés? ¿Y si los abogados intencionalmente y de forma independiente elevados sus precios, luego pasó su nuevo ingreso en el divorcio de los anuncios? Que también parece una explicación plausible.

Este escenario ilustra el número arbitrario de terceros, las variables explicativas que un análisis estadístico puede exhibir. Considere lo siguiente:

  1. Usted no puede medir cada punto de datos,
  2. Desea eliminar todos los no-explicativo datapoint,
  3. Sólo se puede justificar por qué para eliminar un punto de datos si se mida.

Usted tiene un problema. Usted no puede medir cada punto de datos, si desea justificar ignorando no explicativas de puntos de datos, se necesita medir. (Usted puede eliminar algunos puntos de datos sin medición de los mismos, pero es necesario, al menos, justificar).

No hay prueba de la causalidad puede ser correcto en una desenfrenada del sistema.

3voto

k s Puntos 101

Si a y B están correlacionadas, y después de que usted excluidos coincidencia, es más probable que sea a causa B, B causa Una, o algunas, posiblemente, de causa desconocida X causa a y B.

El primer paso consistiría en examinar un posible mecanismo. Podría usted pensar en cómo podría el caso B, o viceversa, o qué tipo de otra causa que X podría causar tanto? (Esto es suponiendo que este examen es más barato que la realización de un experimento tratando de demostrar una causa). Esperemos que terminan en una posición donde un experimento para demostrar la relación de causalidad se ve que vale la pena. Usted puede proceder en caso de que usted no puede pensar en un mecanismo (a causa B, pero no tenemos idea de por qué es una posibilidad).

En ese experimento, usted necesita ser capaz de manipular la sospecha de provocar a voluntad (por ejemplo, si la causa es "tomar la píldora", a continuación, algunas personas le den la píldora, otros no). Luego de tomar las precauciones habituales, recogiendo a la gente obtener o no la píldora al azar, ni a ti ni a las pruebas saber, que recibió la píldora y quién no. También tratan de mantener el resto del experimento de igualdad (dando Una píldora a la gente en un cálido y agradable de la habitación con la luz del sol entraba por la ventana, mientras que el otro grupo recibe un falso píldora en un sucio, incómodo habitación sólo puede afectar a los datos). Así que si usted conclusión de que la única diferencia es que la píldora, y la causa para obtener o no la píldora fue un azar decisión que no afecta a nada más, entonces la correlación puede ser razonablemente declarado causal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X