33 votos

¿Cuándo son útiles los intervalos de confianza?

Si entiendo bien un intervalo de confianza de un parámetro es un intervalo construido por un método que produce intervalos que contienen el valor verdadero para una proporción especificada de muestras. Por tanto, la "confianza" se refiere al método y no al intervalo que calcule a partir de una muestra concreta.

Como usuario de la estadística siempre me he sentido engañado por esto, ya que el espacio de todas las muestras es hipotético. Todo lo que tengo es una muestra y quiero saber qué me dice esa muestra sobre un parámetro.

¿Esta sentencia es errónea? ¿Existen formas de considerar los intervalos de confianza, al menos en algunas circunstancias, que tengan sentido para los usuarios de la estadística?

[Esta pregunta surge de un segundo pensamiento después de despreciar los intervalos de confianza en una respuesta de math.se https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572#7572 ]

15voto

DavLink Puntos 101

Me gusta pensar en los IC como una forma de escapar del marco de la prueba de hipótesis (HT), al menos del marco de decisión binaria que sigue Neyman y se mantiene en línea con la teoría de la medición de alguna manera. Más concretamente, los considero más cercanos a la fiabilidad de una estimación (una diferencia de medias, por ejemplo), y a la inversa, las HT están más cerca del razonamiento hipotético-deductivo, con sus trampas (no podemos aceptar el nulo, la alternativa es a menudo estocástica, etc.). Aun así, tanto con la estimación por intervalos como con la HT tenemos que basarnos en supuestos de distribución la mayor parte del tiempo (por ejemplo, una distribución de muestreo bajo $H_0$ ), lo que permite hacer inferencia desde nuestra muestra a la población general o a una población representativa (al menos en el enfoque frecuentista).

En muchos contextos, las IC son complementarias a la TH habitual, y las veo como en la siguiente imagen (está bajo $H_0$ ):

alt text

es decir, en el marco de la TH (izquierda), se observa la distancia de su estadística con respecto a la nula, mientras que con los IC (derecha) se observa el efecto nulo "de su estadística", en cierto sentido.

Además, hay que tener en cuenta que para cierto tipo de estadísticas, como la odds-ratio, los TH a menudo carecen de significado y es mejor observar su IC asociado, que es asimétrico y proporciona información más relevante en cuanto a la dirección y la precisión de la asociación, si la hay.

7voto

Berek Bryan Puntos 349

Un enfoque alternativo relevante para su segunda pregunta, "¿Existen formas de ver los intervalos de confianza, al menos en algunas circunstancias, que sean significativas para los usuarios de la estadística?":

Debería echar un vistazo a Inferencia bayesiana y la resultante creíble intervalos . Un intervalo de credibilidad del 95% peut interpretarse como un intervalo que usted cree que tiene un 95% de probabilidad de incluir el verdadero valor del parámetro. El precio que se paga es que hay que poner un probabilidad previa distribución sobre los valores que crees que puede tomar el parámetro verdadero antes de la recogida de datos. Y su La prioridad puede diferir de la de otra persona, por lo que los intervalos creíbles resultantes también pueden diferir aunque se utilicen los mismos datos.

Este es sólo mi rápido y burdo intento de resumen. Un buen libro de texto reciente con un enfoque práctico es:

Andrew Gelman, John B. Carlin, Hal S. Stern y Donald B. Rubin. "Bayesian Data Analysis" (2ª edición). Chapman & Hall/CRC, 2003. ISBN 978-1584883883

7voto

Auron Puntos 2123

Tienes razón al decir que los intervalos de confianza del 95% son cosas que resultan de usar un método que funciona en el 95% de los casos, en lugar de que cualquier intervalo individual tenga una probabilidad del 95% de contener el valor esperado.

"La base lógica y la interpretación de los límites de confianza son, incluso ahora, objeto de controversia". {David Colquhoun, 1971, Lectures on Biostatistics}

Esta cita está tomada de un libro de texto de estadística publicado en 1971, pero yo diría que sigue siendo cierta en 2010. La controversia es probablemente más extrema en el caso de los intervalos de confianza para las proporciones binomiales. Hay muchos métodos que compiten para calcular esos intervalos de confianza, pero todos son inexactos en uno o más sentidos e incluso el método que peor funciona tiene defensores entre los autores de libros de texto. Incluso los denominados intervalos "exactos" no ofrecen las propiedades que se esperan de los intervalos de confianza.

En un artículo escrito para cirujanos (¡muy conocidos por su interés en la estadística!), John Ludbrook y yo argumentamos a favor del uso rutinario de intervalos de confianza calculados usando un previo bayesiano uniforme, porque tales intervalos tienen propiedades frecuentistas tan buenas como cualquier otro método (en promedio, exactamente el 95% de cobertura sobre todas las proporciones verdaderas) pero, lo que es más importante, una cobertura mucho mejor sobre todas las proporciones observadas (exactamente el 95% de cobertura). El artículo, debido a su público objetivo, no es terriblemente detallado, por lo que puede no convencer a todos los estadísticos, pero estoy trabajando en un artículo de seguimiento con el conjunto completo de resultados y justificaciones.

Este es un caso en el que el enfoque bayesiano tiene propiedades frecuenciales tan buenas como el enfoque frecuentista, algo que ocurre con bastante frecuencia. La suposición de una prioridad uniforme no es problemática porque una distribución uniforme de las proporciones de la población está incorporada en todos los cálculos de cobertura frecuentista que he encontrado.

Usted pregunta: "¿Existen formas de ver los intervalos de confianza, al menos en algunas circunstancias, que sean significativas para los usuarios de la estadística?" Mi respuesta, entonces, es que para los intervalos de confianza binomiales se pueden obtener intervalos que contengan la proporción poblacional exactamente el 95% de las veces para todas las proporciones observadas. Eso es un sí. Sin embargo, el uso convencional de los intervalos de confianza espera una cobertura para todas las proporciones poblacionales y para eso la respuesta es "¡No!"

La longitud de las respuestas a su pregunta y las diversas respuestas a las mismas sugieren que los intervalos de confianza son ampliamente malinterpretados. Si cambiamos nuestro objetivo de cobertura para todos los valores verdaderos del parámetro a cobertura del valor verdadero del parámetro para todos los valores de la muestra, podría ser más fácil porque entonces los intervalos tendrán una forma directamente relevante para los valores observados en lugar de para el rendimiento del método per se.

6voto

jldugger Puntos 7490

Creo que la premisa de esta pregunta es errónea porque niega la distinción entre el incierto y el conocido .

La descripción del lanzamiento de una moneda ofrece una buena analogía. Antes de lanzar la moneda, el resultado es incierto; después, ya no es "hipotético". Confundir esto Hecho consumado con la situación real que queremos entender (el comportamiento de la moneda, o las decisiones que se van a tomar como consecuencia de su resultado) niega esencialmente el papel de la probabilidad en la comprensión del mundo.

Este contraste se pone de manifiesto en un ámbito experimental o normativo. En estos casos, el científico o el regulador saben que se enfrentarán a situaciones cuyos resultados, de antemano, se desconocen, pero deben tomar decisiones importantes, como la forma de diseñar el experimento o establecer los criterios que se utilizarán para determinar el cumplimiento de la normativa (para pruebas de drogas, seguridad en el lugar de trabajo, normas medioambientales, etc.). Estas personas y las instituciones para las que trabajan necesitan métodos y el conocimiento de la características probabilísticas de esos métodos para desarrollar estrategias óptimas y defendibles, como buenos diseños experimentales y procedimientos de decisión justos que se equivoquen lo menos posible.

Los intervalos de confianza, a pesar de su mala justificación clásica, encajan en este marco teórico de la decisión. Cuando un método para construir un intervalo aleatorio tiene una combinación de buenas propiedades, como asegurar una cobertura mínima esperada del intervalo y minimizar la longitud esperada del intervalo -ambas a priori propiedades, no a posteriori entonces, a lo largo de una larga carrera de uso de ese método, podemos minimizar los costes asociados a las acciones indicadas por ese método.

5voto

dan90266 Puntos 609

Esta es una gran discusión. Creo que los intervalos de credibilidad bayesianos y los intervalos de soporte de probabilidad son el camino a seguir, así como las probabilidades posteriores bayesianas de los eventos de interés (por ejemplo, que un medicamento sea eficaz). Pero sustituir los valores P por los intervalos de confianza es una ganancia importante. Prácticamente todos los números de las mejores revistas médicas, como NEJM y JAMA, tienen un artículo con el problema de "la ausencia de evidencia no es evidencia de ausencia" en sus resúmenes. El uso de los intervalos de confianza evitará en gran medida estos errores. Un pequeño gran texto es http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X