20 votos

Artículo sobre mal uso del método estadístico en NYTimes

Me refiero a este artículo: http://www.nytimes.com/2011/01/11/science/11esp.html

Considere el siguiente experimento. Supongamos que no había razón para creer que una moneda fue ligeramente cargado hacia los jefes. En una prueba, la moneda sale cara 527 veces de cada 1.000.

Es esta evidencia significativa de que la la moneda es ponderado?

El análisis clásico dice que sí. Con un feria de la moneda, las posibilidades de conseguir 527 o más cabezas en 1000 lanzamientos es menos de 1 en 20, o 5 por ciento, el límite convencional. Para decirlo de otra forma: el experimento se encuentra evidencia de de un promedio ponderado de la moneda", con un 95 por ciento confianza".

Sin embargo, muchos estadísticos no lo compre. Uno de cada 20 es la probabilidad de llegar a cualquier número de cabezas por encima de 526 en 1000 lanzamientos. Es decir, es el suma de la probabilidad de un tirón 527, la probabilidad de un tirón 528, 529 y así sucesivamente.

Pero el experimento no encontrar a todos los números en ese rango; se encuentra sólo uno - 527. Es por lo tanto más exacto, estos expertos dicen que, a calcular la probabilidad de obtener que un número - 527 - si la moneda es ponderado, y compararlo con el la probabilidad de obtener el mismo número si la moneda es justo.

Los estadísticos pueden mostrar que esta relación no puede ser más de 4 a 1, de acuerdo a Pablo Speckman, un estadístico, que, con Jeff Rouder, un psicólogo, siempre el ejemplo.

Primera pregunta: Esto es nuevo para mí. Alguien ha una referencia de donde puedo encontrar el cálculo exacto y/o me puede ayudar dándome el cálculo exacto a ti mismo y/o puede que me apunte a algún material donde puedo encontrar ejemplos similares?

Bayes ideado una manera de actualizar el la probabilidad de una hipótesis como nuevo la evidencia viene en.

Así, en la evaluación de la fuerza de un dado encontrar, Bayesiano (pronunciado BAYZ-ee-onu), el análisis incorpora probabilidades conocidas, si está disponible, desde fuera del estudio.

Podría ser llamado el "sí, Sí" efecto. Si un estudio encuentra que los quinotos reducir el riesgo de enfermedades del corazón en un 90 por ciento, que un tratamiento de cura la adicción al alcohol en una semana, que sensible padres tienen el doble de probabilidades para dar a luz a una niña como a un niño, el Bayesiano respuesta coincide con la de el nativo escéptico: sí, Sí. El los resultados del estudio se pesaba en contra de lo que es observable en el mundo.

En al menos un área de la medicina - diagnóstico las pruebas de detección - los investigadores utilizan ya conocido las probabilidades para evaluar nuevas los hallazgos. Por ejemplo, un nuevo mentira-prueba de detección puede ser de 90 por ciento exacto, correctamente marcar 9 de 10 mentirosos. Pero si se da a una población de 100 personas ya se sabe para incluir 10 mentirosos, la prueba es mucho menos impresionante.

Identifica correctamente 9 de los 10 mentirosos y falta uno; pero identifica incorrectamente 9 de los otros 90 como la mentira. Dividiendo el llamado verdaderos positivos (9) por el número total de la gente la prueba de marcado (18) da un índice de exactitud de 50 por ciento. El los "falsos positivos" y "falsos negativos" que dependen de la conocida tasas de en la población.

Segunda pregunta: ¿Cómo exactamente juzgar si un nuevo hallazgo es "real" o no con este método? Y: ¿no es esto tan arbitraria como el 5% de la barrera, debido a la utilización de algunos de preset antes de probabilidad?

31voto

Marc-Andre R. Puntos 789

Voy a responder a la primera pregunta en detalle.

Con una moneda, la probabilidad de llegar 527 o más cabezas de cada 1.000 voltea es menos de 1 en 20, o 5 por ciento, el límite convencional.

Para una feria de la moneda el número de cabezas de 1000 ensayos sigue la distribución binomial con el número de pruebas de $n=1000$ y la probabilidad de $p=1/2$. La probabilidad de obtener más de 527 cabezas es entonces

$$P(B(1000,1/2)>=527)$$

Esto puede ser calculado con cualquier paquete de software estadístico. R nos da

> pbinom(526,1000,1/2,lower.tail=FALSE)
   0.04684365

Así que la probabilidad de que con la feria de la moneda que vamos a conseguir más de 526 cabezas es de aproximadamente 0.047, que es cerca de 5% cuttoff mencionado en el artículo.

La siguiente declaración

Para decirlo de otra manera: el experimento encuentra evidencia de un promedio ponderado de la moneda "con el 95 por ciento de confianza."

es discutible. Yo estaría dispuesto a decir que, dado que el 95% de confianza puede ser interpretado de varias maneras.

Luego giramos a la

Pero el experimento no encontrar a todos los números en ese rango; se encuentra sólo uno - 527. Es por lo tanto más exacto, estos expertos dicen que, a calcular la probabilidad de obtener que un número - 527 - si la moneda es ponderado, y compararlo con el la probabilidad de obtener el mismo número si la moneda es justo.

Aquí podemos comparar dos eventos $B(1000,1/2)=527$ -- feria de la moneda, y $B(1000,p)=527$ -- ponderado de la moneda. La sustitución de las fórmulas para las probabilidades de estos eventos, y observa que el coeficiente binomial cancela tenemos

$$\frac{P(B(1000,p)=527)}{P(B(1000,1/2)=527)}=\frac{p^{527}(1-p)^{473}}{(1/2)^{1000}}.$$

This is a function of $p$, con lo que hemos cand de los mínimos o máximos. En el artículo podemos inferir que necesitamos maxima:

Los estadísticos pueden mostrar que esta relación no puede ser más de 4 a 1, de acuerdo a Pablo Speckman, un estadístico, que, con Jeff Rouder, un psicólogo, siempre el ejemplo.

Para hacer la maximización más fácil tomar el logaritmo de la relación, calcular la derivada con respecto al $p$ e igualamos a cero. La solución será

$$p=\frac{527}{1000}.$$

We can check that it is really a maximum using second derivative test for example. Substituting it to the formula we get

$$\frac{(527/1000)^{527}(473/1000)^{473}}{(1/2)^{1000}}\approx 4.3$$

Así que la relación es de 4,3 a 1, lo cual está de acuerdo con el artículo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X