26 votos

¿Por qué estas declaraciones no se siga lógicamente de un IC de 95% para la media?

He estado leyendo Hoekstra et al 2014 artículo sobre "la Sólida interpretación de intervalos de confianza", que he descargado de Wagenmakers del sitio web.

En la penúltima página de la imagen siguiente aparece.

Quiz

Según los autores, la Falsa es la respuesta correcta a todas estas declaraciones. No estoy muy seguro de por qué las declaraciones son falsas, y como lo que puedo decir que el resto del documento no intenta explicar esto.

Creo que 1-2 y 4 no son correctos debido a que afirman algo sobre el valor probable de la verdadera media, cuando la verdadera media tiene un valor definido que es desconocido. Es este un convincente distinción?

Respecto a la 3, entiendo que uno no está destinado a hacer afirmaciones acerca de la probabilidad de la hipótesis nula es incorrecta, aunque no estoy tan seguro de la razón por qué.

Del mismo modo 6 no puede ser verdad, porque implica que la verdadera media está cambiando de experimento a experimento.

El que yo realmente no entiendo en absoluto es 5. ¿Por qué es que uno malo? Si tengo un proceso en el que el 95% del tiempo produce CIs que contienen la verdadera media, ¿por qué no puedo decir que tengo un 95% de confianza el valor de población está entre 0,1 y 0,4? Es a causa de que podamos tener una información especial acerca de la muestra que nos tomamos que nos haría pensar que es probable que sea uno de los 5% que no contiene la verdadera media? Por ejemplo, 0.13 está incluido en el intervalo de confianza y, por alguna razón 0.13 no se considera un valor plausible dentro de algunos específico contexto de la investigación, por ejemplo, debido a que el valor estaría en conflicto con la teoría anterior.

¿Qué confianza significa en este contexto, de todos modos?

11voto

jldugger Puntos 7490

El significado de la pregunta (5) depende de algunos encubiertos de la interpretación de "confianza". He buscado en el papel con cuidado y se encontró ningún intento de definir la "confianza" o de lo que podría significar en este contexto. El papel de la explicación de su respuesta a la pregunta (5) es

"... [es] menciona los límites de la CI ... mientras que un CI puede ser utilizado para evaluar el procedimiento y no un intervalo de tiempo específico."

Esto es engañoso y confuso. En primer lugar, si usted no puede evaluar el resultado del procedimiento, entonces lo bueno que es el procedimiento en el primer lugar? Segundo, el enunciado de la pregunta no es sobre el procedimiento, pero sobre el lector de la "confianza" en sus resultados.

Los autores defienden a sí mismos:

"Antes de continuar, es importante recordar la definición correcta de un CI. El CI es un número de intervalo construido en torno a la estimación de un parámetro. Ese intervalo, sin embargo, no indicar directamente una propiedad del parámetro; en cambio, indica una propiedad de la intervención, como es típico para un frecuentista de la técnica."

Su prejuicio surge en la última frase: "frecuentista de la técnica" (escrito, tal vez, con un desprecio implícito). Aunque esta caracterización es correcta, es muy incompleta. Ella no se da cuenta de que un intervalo de confianza es también una propiedad de los métodos experimentales (cómo se obtuvieron muestras y medida) y, lo que es más importante, de la misma naturaleza. Esa es la única razón por la que alguien podría estar interesado en su valor.

Recientemente he tenido el placer de leer Edward Batschelet la Estadística Circular en Biología (Academic Press, 1981). Batschelet escribe claramente y al punto, en un estilo dirigido en el trabajo científico. Aquí es lo que él dice acerca de los intervalos de confianza:

"Una estimación de un parámetro sin indicaciones de las desviaciones causadas por casualidad fluctuaciones tiene poco valor científico. ...

"Mientras que el parámetro a estimar es un número fijo, los límites de confianza se determina por la muestra. Son las estadísticas y, por lo tanto, depende de la oportunidad de las fluctuaciones. Diferentes muestras extraídas de la misma población que conducen a los diferentes intervalos de confianza."

[El énfasis es en el original, en la pp 84-85.]

Observe la diferencia en el énfasis: considerando que el documento en cuestión se centra en el procedimiento, Batschelet se centra en la muestra y, específicamente, en lo que puede revelar acerca de los parámetros y cómo esa información puede ser afectada por la "posibilidad de fluctuaciones." Esto me parece descaradamente práctica, el enfoque científico mucho más constructivo, iluminando, y-en última instancia,--útil.

Una mejor caracterización de los intervalos de confianza que la que ofrece el papel, por tanto, tendría que proceder algo como esto:

El CI es un número de intervalo construido en torno a la estimación de un parámetro. Nadie estaba de acuerdo con los supuestos que subyacen en el CI de la construcción se justifica diciendo que está seguro de que el parámetro se encuentra dentro del intervalo: este es el significado de "confianza". Este significado es, en líneas generales, de acuerdo con los convencionales no-significados técnicos de confianza porque en muchas repeticiones del experimento (si son o no realmente) el CI, aunque varíe, se espera que contenga el parámetro de la mayoría de las veces.

En esta completa, más convencional, y más sentido constructivo de "confianza", la respuesta a la pregunta (5) es verdadera.

10voto

SHU Puntos 18

Preguntas 1-2, 4: análisis frecuentista, la verdadera media no es una variable aleatoria, por lo tanto estas probabilidades no están definidos, mientras que en el análisis Bayesiano las probabilidades dependerá de la previa.

Pregunta 3: Por ejemplo, considere un caso en el que tenemos la certeza de Que aún sería posible obtener estos resultados, sino descabellado afirmar que la hipótesis nula es 'raro' para ser verdad. Se obtuvieron datos que es poco probable que ocurra si la hipótesis nula es verdadera, pero esto no implica que la hipótesis nula es poco probable que sea cierto.

Pregunta 5: Esto es un poco cuestionable ya que esto depende de la definición de "podemos ser p % seguro." Si definimos la declaración en el sentido de lo que se deduce de p % intervalos de confianza, la declaración es, por definición correcta. El típico pro-Bayesiano argumento de los estados que las personas tienden a interpretar estas declaraciones intuitivamente significa "la probabilidad es p %", lo que sería falso (comparar sus respuestas a 1-2,4).

Pregunta 6: Su explicación "implica que la verdadera media está cambiando de experimento a experimento" es exactamente correcto.

El artículo ha sido abordada recientemente en Andrew Gelman blog (http://andrewgelman.com/2014/03/15/problematic-interpretations-confidence-intervals/). Por ejemplo, la cuestión relativa a la interpretación de la declaración en la pregunta 5 se discute en los comentarios.

7voto

Rodrigo Guedes Puntos 111

Con respecto a la intuición de la falsedad de la Pregunta 5, puedo obtener la siguiente discusión sobre este tema a partir de aquí

Es correcto decir que hay un 95% de probabilidad de que el intervalo de confianza se calcula contiene la verdadera media de población. No es correcto decir que hay un 95% de posibilidades de que la población se encuentra dentro del intervalo.

¿Cuál es la diferencia? La población tiene un valor. Usted no sabe lo que es (a menos que usted está haciendo simulaciones), pero tiene un valor. Si se repite el experimento, que el valor no cambia (y aún así no sé lo que es). Por lo tanto, no es estrictamente correcto para preguntar acerca de la probabilidad de que la población se encuentra dentro de un cierto rango. En contraste, el intervalo de confianza de calcular depende de los datos que se pasó a recoger. Si se repite el experimento, su intervalo de confianza casi seguro que sería diferente. Así que está bien para preguntar acerca de la probabilidad de que el intervalo contiene la media de población.

Ahora a sus preguntas específicas sobre 5. ¿Por qué está mal...

  1. Es a causa de que podamos tener una información especial acerca de la muestra que nos tomamos que nos haría pensar que es probable que sea uno de los 5% que no contiene la verdadera media? No, más bien, creo que es porque la verdadera media no es una variable aleatoria, pero el intervalo de confianza es una función de los datos.
  2. ¿Qué confianza significa en este contexto, de todos modos? Un intervalo de confianza permite (confianza - si usted confía en sus suposiciones) que para hacer una afirmación de que el intervalo cubre el verdadero parámetro. La interpretación refleja la incertidumbre en el procedimiento de muestreo; un intervalo de confianza de $100(1-\alpha)$% afirma que [usted puede estar seguro de que], en el largo plazo, $100(1-\alpha)$% de la realizada a intervalos de confianza cubrir el verdadero parámetro.

Como una nota al margen (mencionado en otras respuestas a esta pregunta), un intervalo creíble, de un concepto de la estadística Bayesiana, hacen predecir que el verdadero valor del parámetro tiene una probabilidad de estar en el intervalo de confianza de la vista de los datos obtenidos. Tal vez usted puede obtener más antecedentes sobre este de Gelman blog.

2voto

Zizzencs Puntos 1358

Aquí está la definición de un intervalo de confianza, de B. S. Everitt del Diccionario de Estadísticas:

"Un rango de valores, calculados a partir de las observaciones de la muestra, que se creía que, con cierta probabilidad, a contener el verdadero parámetro valor. Un 95% CI, por ejemplo, implica que se el proceso de estimación. repite una y otra vez, entonces el 95% del cálculo de los intervalos de se espera que contenga el verdadero valor del parámetro. Tenga en cuenta que la declaró nivel de probabilidad se refiere a las propiedades del intervalo y no a la parámetro sí mismo, que no se considera una variable aleatoria"

Un error muy común es confundir el significado de un intervalo de confianza con un intervalo creíble, ALIAS "Bayesiano" intervalo de confianza", que hace declaraciones similares a las de las preguntas.

He oído que los intervalos de confianza son a menudo similares a intervalos de credibilidad que se deriva de un informativo previo, pero que me contó como anécdota (aunque por un hombre que respeto mucho), y no tengo los detalles o cita.

1voto

jasonmray Puntos 1303

Sin ninguna definición formal de lo que significa ser "de confianza del 95%", ¿qué justificación hay para el etiquetado #5 ¿verdadero o falso? Un laico, sin duda, malinterpretarlo como sinónimo de un 95% de probabilidad de que la media está en ese intervalo: pero algunas personas hacen uso de ella, en el sentido de haber utilizado un intervalo método de generación de cuyos intervalos contienen la verdadera media 95% del tiempo, precisamente para evitar hablar acerca de la distribución de probabilidad de un parámetro desconocido, lo cual parece natural suficiente extensión de la terminología.

La estructura similar de la instrucción anterior (#4) podría haber alentado a los encuestados para intentar trazar una distinción entre "nosotros podemos ser de confianza del 95%" & "hay un 95% de probabilidad" incluso si ellos no había considerado la idea antes. Yo había esperado este tricksiness para llevar a #5 que tiene la mayor proporción de acuerdo—mirando el papel, me enteré de que estaba mal, pero se nota que al menos el 80% de leer el cuestionario en una versión holandesa, que tal vez debería plantear preguntas acerca de la pertinencia de la traducción al inglés.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X