Explicar el concepto de causalidad desde una perspectiva filosófica es un gran tema, y probablemente sea mejor dejárselo a los filósofos, aunque es útil para un estadístico tener un conocimiento práctico de este tema filosófico. Personalmente, la explicación de Peikoff la mejor explicación que he oído (es decir, que la causalidad es la "ley de la identidad" aplicada a la acción). Desde este punto de vista, preguntar por la causalidad es en realidad preguntar por las acciones que realizan las cosas cuando se ven sometidas a diversos tipos de estímulo/intervención por parte de otras cosas. En por qué algo sucede es realmente sólo pedir una descripción más profunda de qué ocurre cuando una cosa interactúa con otra.
Siempre me ha parecido que la mejor manera de ver causalidad probabilística está dentro del "marco bayesiano "subjetivo lo que la hace compatible con las explicaciones metafísicas deterministas de la causalidad. Desde el punto de vista bayesiano, la probabilidad se considera simplemente una herramienta epistemológica que permite al usuario medir su incertidumbre sobre cantidades desconocidas, limitada por criterios de racionalidad. Desde este punto de vista, la probabilidad se interpreta epistemológicamente y, por tanto, la causalidad probabilística también se interpreta epistemológicamente, no metafísicamente. Este punto de vista reconoce que a menudo estamos expuestos a datos que nos parecen "estocásticos" (es decir, bien descritos por métodos probabilísticos) aunque estén formados por un proceso subyacente que es determinista. Una de las ventajas de este marco es que es agnóstico con respecto al determinismo, es decir, es compatible con las explicaciones metafísicas de la causalidad, tanto deterministas como no deterministas.
La cuestión aquí es que estos diferentes "tipos" de causalidad no tienen por qué considerarse competidores que se contradicen entre sí. En el marco bayesiano "subjetivo", cuando hablamos de "causalidad probabilística", en realidad sólo estamos hablando de cómo podemos infiera causalidad utilizando las herramientas de la teoría de la probabilidad. "Causalidad" puede seguir interpretándose como una condición metafísica subyacente que tratamos de inferir con herramientas epistemológicas. Además, puede interpretarse de forma determinista. En este marco, las condiciones de probabilidad no son una formulario de causalidad, sino condiciones que permiten inferencia de una causalidad metafísica subyacente. Por esta razón, nunca me ha gustado el nombre de "causalidad probabilística"; en su lugar, debería llamarse "métodos probabilísticos de inferencia de la causalidad".
Ejemplo (fumar): Aplicar este marco al tabaquismo permite aceptar una explicación médica celular simple de lo que es el cáncer, al tiempo que se utilizan herramientas probabilísticas para intentar inferir la causalidad. A un nivel físico profundo, el cáncer está "causado" por el tabaquismo en el sentido de que varias células del cuerpo (por ejemplo, en los pulmones) comienzan a emprender un crecimiento anormal (perjudicial) cuando se exponen a las partículas de humo de una forma determinada. Este proceso podría ser totalmente determinista, a pesar de que se produce a un nivel de detalle que impide nuestra capacidad para predecir con exactitud cuándo una célula concreta se volverá cancerosa bajo la exposición al humo. De hecho, es razonable conjeturar que fumar lleva a las células a estar expuestas a partículas de humo de diferentes composiciones químicas desde diferentes ángulos, frecuencias, etc., y que incluso si el proceso de crecimiento del cáncer en las células es determinista, las condiciones de exposición varían tanto que nos parecen estocásticas.
Podemos aceptar aquí una explicación determinista de la causalidad y seguir utilizando los ensayos estadísticos y la teoría de la probabilidad para infiera causalidad. En el mejor de los casos, se trata de ensayos controlados o, si se trata de observaciones no controladas, con las debidas advertencias sobre la inferencia. Intentamos controlar los factores de confusión y evitar el control de los factores de colisión para obtener una inferencia sobre la causalidad subyacente, en lugar de una mera inferencia predictiva.
Explicando esto en términos profanos: ¡Chico, eso es duro! El primer paso es explicarlo a nosotros mismos en términos técnicos (véase más arriba), ¡para que nuestros conceptos estén bien integrados y sean coherentes antes de someter a nuestros puntos de vista a esos pobres profanos! Si intentara explicar lo anterior en términos profanos, diría algo así:
Cuando preguntamos por la causa, en realidad sólo pedimos una explicación más detallada de cómo actúa una cosa cuando está expuesta a un determinado tipo de condiciones. Por ejemplo, ¿cómo reaccionan los pulmones de una persona al fumar? ¿Se vuelven cancerosos? Los estadísticos nos dicen que la mejor forma de averiguarlo es realizando un experimento en el que se exponen los pulmones al humo de forma aleatoria (por ejemplo, hacer que algunas personas fumen y otras no) y luego ver quién contrae cáncer. A continuación, utilizamos métodos estadísticos con estos datos para ver si las personas que fumaban tenían más probabilidades de contraer cáncer.
A veces no podemos hacer un ensayo controlado aleatorio como éste. En este caso, podría ser poco ético/impráctico ordenar fumar a personas que no quieren hacerlo. (¡El ensayo sólo funciona si los fumadores asignados al azar aceptan fumar!) En estos casos seguimos observando quién contrae cáncer y quién fuma, pero es más difícil averiguar si fumar está causando cáncer. Hay una teoría bastante complicada sobre cómo hacerlo; es bastante difícil y es fácil cometer errores.
Los estadísticos tienen una teoría muy desarrollada sobre cómo saber cuándo una cosa causa otra. Lo necesitan porque es difícil saber cuándo unas cosas causan a otras. En cualquier caso, esta teoría de utilizar la probabilidad para averiguar la causa se denomina a veces "causalidad probabilística"; nos indica las condiciones que necesitamos para poder inferir que un estímulo causa una respuesta determinada.