El problema de comparar conjuntos creíbles e intervalos de confianza es que no son comparaciones de manzanas con manzanas o de manzanas con naranjas. Son una comparación de manzanas con tractores. Sólo son sustitutos el uno del otro en determinadas circunstancias.
El uso principal de un intervalo de confianza es en la investigación científica. Aunque las empresas los utilizan, su valor es menor ya que a menudo es difícil elegir una acción basada en un intervalo. Los métodos estadísticos empresariales aplicados tienden a favorecer las estimaciones puntuales por razones prácticas, aunque los intervalos se incluyan en los informes. Cuando se incluyen, la mayoría de las veces son como advertencias.
Los conjuntos creíbles tienden a ser menos utilizados en los métodos bayesianos, ya que se informa de toda la parte posterior, así como de los marginales. Se informan y proporcionan descriptivamente una sensación de los datos si no se proporciona un gráfico de la posterior, pero no tienen la misma utilidad que los intervalos de confianza porque significan algo diferente.
Hay cuatro casos en los que se tiende a ver un conjunto creíble en lugar de un intervalo de confianza, pero no estoy seguro de que la mayoría de ellos sean prácticos. Ocurre, pero no a menudo.
La primera ya se ha mencionado. Hay veces que un intervalo de confianza parece producir un intervalo patológico. Este uso no me gusta tanto. Es importante recordar que los procedimientos de confianza producen intervalos válidos al menos $1-\alpha$ por ciento de las veces a la repetición infinita, pero el precio de eso puede ser un sinsentido total a veces. No estoy seguro de que eso sea una buena razón para descartar un método frecuentista.
Los eventos raros o generalizados son un ejemplo típico. Si un porcentaje suficientemente alto de una población hace o deja de hacer algo, puede parecer que todo el mundo o nadie hace algo. Como los intervalos frecuentistas se construyen en torno a estimaciones puntuales, y la muestra no tiene varianza, el intervalo carece de rango. Me parece inquietante abandonar un método porque a veces produce un resultado que otros pueden no aceptar. La virtud de un método frecuentista es que toda la información procede de los datos. Lo que ocurre es que los datos no tenían suficiente información.
Sin embargo, esa no es la suma de todas las patologías. Otras patologías pueden fomentar el uso de un método bayesiano porque puede existir un método frecuencial apropiado pero no se puede encontrar. Por ejemplo, la coordenada media muestral de los puntos de un donut centrado en $(0,0,0)$ debe estar cerca de $(0,0,0)$ pero no hay ningún donut allí. Ahí es donde está el agujero del donut. Un rango construido alrededor de un punto no soportado puede fomentar una alternativa bayesiana si la información sobre la forma no puede ser incluida en la solución no bayesiana por alguna razón.
La segunda razón tiene un análogo frecuencial parcial, el caso de la información externa. En el caso general, en el que existe investigación externa sobre un parámetro de interés, tanto un prior bayesiano como un meta-análisis frecuencial producen intervalos utilizables. La dificultad ocurre cuando el conocimiento externo no está contenido en los datos, per se, sino en el conocimiento externo.
Algunos conocimientos se apoyan en la teoría y en las observaciones de estudios no relacionados, pero deben mantenerse lógicamente. Por ejemplo, consideremos el caso de un objeto bien diseñado que debería oscilar entre 1 y 0. Si llega a 0, entonces termina. El siguiente valor $x_{t+1}=\beta{x}_t+\epsilon,0<\beta<1$ . Sólo puede tener un valor de 1 en $t=0$ . Puede darse el caso de que $x_t$ puede subir o bajar, pero nunca puede llegar a 1 de nuevo y se detiene en 0. Además, porque está bien diseñado, $\beta=.9999999\pm{.00000001}$ . Por supuesto, podríamos habernos engañado sobre la verdadera tolerancia. Ese es el problema cuando se utiliza un método bayesiano.
En el caso del producto bien diseñado, los intervalos de confianza son demasiado conservadores y sobreestiman el rango del intervalo. En ese caso, puede ser trivialmente cierto que un intervalo del 95% lo cubre al menos el 95% de las veces porque puede ser tan amplio, dado que se excluyó la información previa de su construcción, que debería cubrir el parámetro casi el 100% de las veces.
El tercer caso se da cuando algo es un hecho puntual en lugar de un hecho repetitivo. Curiosamente, se puede crear un caso en el que un intervalo de confianza es el intervalo válido para una parte, y un conjunto creíble es el intervalo válido para otra parte con los mismos datos.
Considere una empresa de fabricación que produce algún producto que falla de vez en cuando. Quiere garantizar que, al menos el 99% de las veces, puede recuperarse del fallo basándose en un intervalo. Un intervalo de confianza proporciona esa garantía. Sin embargo, la parte que compra un producto que ha fallado puede querer un intervalo que tenga un 99% de posibilidades de ser el intervalo correcto para solucionar el problema, ya que éste no se repetirá, y sólo debe funcionar esta vez. Les preocupan los datos que tienen y el único evento que experimentan. No les importa la eficacia del producto para los demás clientes de la empresa.
El cuarto caso puede no tener análogos en el mundo real, pero tiene que ver con la diferencia en el tipo de pérdida que se experimenta. La mayoría de los procedimientos frecuentistas son procedimientos mini-max. Minimizan la cantidad máxima de riesgo a la que se está expuesto. Esto también es cierto para los procedimientos de confianza. La mayoría de las estimaciones bayesianas de intervalo minimizan la pérdida media. Si su preocupación es minimizar la pérdida media por usar un intervalo construido por una muestra no representativa, entonces debería usar un conjunto creíble. Si lo que le preocupa es asumir el menor riesgo posible, entonces debería utilizar un intervalo de confianza.
Pero volviendo a las manzanas y los tractores, estos no ocurren tan a menudo. Los procedimientos frecuentistas superaron el paradigma bayesiano preexistente porque funcionan en la mayoría de los entornos para la mayoría de los problemas. Los procedimientos bayesianos son claramente superiores en algunos casos, pero no necesariamente los intervalos bayesianos.
Los casos del mundo real para los conjuntos creíbles bayesianos son cosas como la búsqueda y el rescate, porque pueden actualizarse rápida y fácilmente y pueden utilizar conocimientos sin investigación previa. También puede ser superior cuando faltan cantidades significativas de datos porque los métodos bayesianos pueden tratar un punto de datos que falta como si fuera un parámetro. Esto puede evitar un intervalo patológico creado por la pérdida de información, ya que puede marginar el impacto de los datos que faltan.
Se trata de una suposición personal basada en la observación de que los métodos bayesianos no se utilizan mucho en comparación, pero no estoy tan convencido de que un intervalo tenga el mismo valor en el lado bayesiano de la moneda.
Los métodos frecuentistas se construyen en torno a los puntos. Los métodos bayesianos se basan en distribuciones. Las distribuciones contienen más información que un solo punto. Los métodos bayesianos pueden dividir la inferencia y la probabilidad de las acciones realizadas en función de esas probabilidades.
Si un intervalo es útil, se puede aplicar una función de pérdida a la parte posterior, y se pueden descubrir los límites del intervalo. En ese caso, se trata de un formalismo para apoyar una acción adecuada dados los datos.
No sospecho que el uso específico se produzca tanto, excepto en la gestión de riesgos, donde los rangos son esenciales. No sé si se da mucho en ese caso.
Los intervalos de confianza aportan más información que las estimaciones puntuales. Los conjuntos de confianza son una técnica de reducción de la información.
Un intervalo de confianza de $7\pm{3}$ no está dando la misma información que un conjunto creíble de $[6,7]\cup[7.5,9]$ para los mismos datos.