6 votos

Otro p-valor falacia

Wikipedia ejemplos de decir que una moneda es injusto si se genera una secuencia 1111111. Una alta alternancia de la tasa, tal como 1010101010, sería igualmente injusto.

Lo que es una falacia pensar que una moneda es injusto sobre la base de que es igualmente improbable para ver cualquier secuencia?

Me refiero a que normalmente se "resuelve" declarando el hecho de que P(11111111) = P(00000000) = P(01010101) = P(10101010) = P (010101000) = P(cualquier otra secuencia). Esto explica que la moneda es justo. Pero, yo lo interpreto como no puede ser de cualquier feria de la moneda sólo a causa de la identidad de todas las probabilidades y porque P(todas) = P(cualquier secuencia), etc, todo ser altamente improbable.

Ahora, tenemos que la feria de la moneda no puede ser justo. Dónde está la falacia y cómo aplicar el p de la prueba correctamente?

editar La hipótesis de que la moneda es justo y la estadística es la probabilidad de que ocurra la secuencia. Puedo calcular la probabilidad de que se produjo la secuencia a partir de la hipótesis. Para cualquier suficientemente larga secuencia, la probabilidad teórica es demasiado bajo y, por lo tanto, la justicia debe ser rechazado. Dónde está la falacia?

edit2 ¿por Qué nadie puede decir simplemente que la trampa se señaló en el primer Wikipedia ejemplo: p-criterios de no tomar el tamaño de la muestra en cuenta? Incluso se puede trivializar el problema. Olvidar la serie. Vamos a evaluar la probabilidad de seleccionar un solo item38 bajo la suposición de uniforme 0-100 distribución. Obviamente, es del 1%, que es lo suficientemente baja como para ser escogido por casualidad. Pero, las estadísticas muestran que el elemento aparece en el 100% de los casos (1 vez por 1 experimento). Obviamente, esto no puede ser por casualidad, según p-prueba de nivel, sin embargo, el tamaño de la muestra es también insuficiente. Así, p de la prueba debe ser complementado por el tamaño de la muestra de análisis. Es una falacia olvidarse de esto. A la derecha?

Una pregunta relacionada: que será de distribución tienen la probabilidad de escoger item38 si me dibujar varias muestras? ¿Cómo puedo tomar el integral de "casos extremos"?

8voto

jasonmray Puntos 1303

Un procedimiento de prueba que se va como esto:

(1) Definir el espacio muestral: 1024 resultados de lanzar una moneda 10 veces

(2) Estado de la hipótesis nula: Una feria de la moneda; es decir,$\mathsf{H}$ & $\mathsf{T}$ equiprobables, arroja independiente

(3) Definir un estadístico de prueba: Usted puede utilizar la suma de los jefes, o el número de carreras, o lo que te guste

(4) Realizar el experimento y calcular el valor observado de la prueba estadística: Tirar la moneda al aire 10 veces

(5) Calcular la probabilidad (bajo la hipótesis nula) de obtener un valor del estadístico de prueba igual o superior a la observada.

El resultado de (5) es el p-valor. Permite calibrar la estadística de prueba. Supongamos que la hipótesis nula fuese cierto: si usted sigue este procedimiento de prueba muchas veces y rechazar la hipótesis nula (erróneamente) cada vez que se obtuvo un valor de la prueba estadística de este grande o más grande, tendría que rechazarla (erróneamente) una fracción $p$ de las ocasiones.

La parte difícil es (3). Lo correcto acerca de su intuición es que cada secuencia particular puede ser visto como favorecer a algunos alternativa u otra contra el null—hay tantas maneras diferentes de una moneda puede ser injusta. Pero usted tiene que elegir un estadístico de prueba que le da una cierta discriminación. El recuento de cabezas es buena si desea probar si la probabilidad de cara es diferente a la de la mitad, y no son tan dudoso de la independencia. El recuento de ejecuciones del mismo lado es bueno si usted está más preocupado por la independencia. Si alguien le dice que él va a lanzar $\mathsf{HHTHTHHHTT}$ luego de poner a prueba su habilidad puedes dejar que tu estadístico de prueba igual a uno cuando sólo que la secuencia de la que surge, y cero en caso contrario. Lo que no puedes hacer es mirar en una secuencia particular después del experimento, dicen que habría sido extremadamente improbables de acuerdo a la prueba estadística u otros, y cita un valor de p basado en eso.

[En respuesta a tu comentario:

(a) El valor de p $\mathsf{HHTHTHHHTT}$ es en general no $\frac{1}{1024}$, pero depende de la prueba estadística que se utiliza. Si el número de cabezas se utiliza como estadístico de prueba (como es cuando la alternativa de interés es que la probabilidad de cara es mayor que $\frac{1}{2}$), los casos más extremos son los recuentos de 7, 8, 9, & 10, & las probabilidades de estos recuentos se podría sintetizarse en el p-valor. Me dio un ejemplo de alguien diciendo que la intención de lanzar $\mathsf{HHTHTHHHTT}$, y en este caso, pero ciertamente no en todos los casos, sería sensato para definir la estadística de prueba tal que $\mathsf{HHTHTHHHTT}$ fue el más extremo valor.

(b) Se puede calcular qué probabilidades que te gusta antes y después del experimento, pero válido p-valores se derivan de un estadístico de prueba definida de antemano, o en cualquier caso, independientemente de los resultados observados. Si usted elige a su estadística de prueba en función de los resultados observados, se está siguiendo un procedimiento diferente al descrito anteriormente, y la interpretación en términos de las tasas de error más hipotético repeticiones—que es el punto entero de la introducción de los valores de p—dejará de ser relevante.

(c) no puede seguir su argumento en el tamaño de la muestra. Exacto p-valor será válida independientemente del tamaño de la muestra.]

4voto

Nick Cox Puntos 22819

Yo no creo que esto es algo para hacer con P-valores. En cualquier caso, en ninguna parte especifica prueba de lo que usted tiene en mente.

La definición habitual de una moneda que le llevo a ser que las cabezas y las colas son igualmente probables, pero nada excluye la "imparcialidad" de ser un concepto vago que puede ser hecho precisa de varias maneras. En la práctica también se debe ser cauteloso-para tomar un ejemplo-perfecto alternancia entre la cabeza y la cola y la sospecha de la moneda -- o más al punto tal vez, la máquina o de la persona que desecharlo. Otros tipos de regularidad también puede ser imaginado.

En ese caso, lo que hay que hacer es establecer una prueba específica para ese tipo de comportamiento y calcular los valores de P (o, preferiblemente con algún tipo de intervalo de confianza para un parámetro clave). Como alternativa, vaya Bayesiano como usted desea.

Así que, no veo nada aquí excepto la idea de que la pregunta equivocada puede dar una respuesta irrelevante.

1voto

Sami Kujala Puntos 60

¿Cuál es el modelo implícito?

La probabilidad p = 1/1024 se deriva de la feria modelo de la moneda de $\Pr(H)=\Pr(T)=0.5$ independiente de la lanza, es decir,$Cov(n_i,n_{i-1})=1$. Tenga en cuenta que este modelo es invariante a la secuencia de lanzamientos, es decir,$\Pr(HHT)=\Pr(HTH)=\Pr(THH)$.

Bajo este modelo, una secuencia como HTHTHTHT es sospechoso, porque viola la segunda condición - la lanza no mostrar la independencia.

Sin embargo, OP pregunta por qué no deberíamos considerar cualquier n-tupla a ser sospechoso, ya que la probabilidad de cualquier n-tupla es $1 \over2^n$, que para $n>5$ está por debajo de la "tradicional" cut-off de $p<0.05$. Lo OP, al no reconocer en esta pregunta es que él es el uso de un modelo de individuo que arroja el modelo de la p-valor de n-tuplas.

En mi opinión, el modelo adecuado es $H_0:\Pr(T_{k,i})=\Pr(T_{k,i}) \forall i,j$ frente al $H_A:\exists i,j: \Pr(T_{k,i}) \neq \Pr(T_{k,j})$ donde $T_{k,i}$ es la i-esima k-tupla. Esto sigue una distribución multinomial con k de los resultados, y el estadístico de prueba se pueden derivar.

0voto

auselen Puntos 121

Sobre la posibilidad de un malentendido, yo voy a adivinar sobre lo que podría significar.

Supongo que su hipótesis es que la moneda es justo, ¿verdad? Y su problema es cómo probar esto si, de hecho, todas las secuencias de por sí tienen la misma probabilidad de ocurrir. Sin embargo, cuando estamos hablando de los valores de p, esto normalmente no tiene importancia. Al menos no para las monedas acuñadas por el banco central de estadísticas de los libros, si se quiere.

Así, si la moneda si justo entonces podemos (por ejemplo) suponga que el lanzamiento es un experimento al azar que es de Bernoulli distribuido. Si asumimos que, entonces podemos afirmar que el resultado de "1111111..." es el resultado de un n-distribución Binomial de n lanzamientos de la moneda.
Y nuestra hipótesis es entonces que el experimento de lanzar la moneda n veces con k éxitos se deriva de una distribución de probabilidad binomial. En este caso, k=la cantidad de "1" que tenemos, o nuestros éxitos.

Así que podemos probar la hipótesis y vamos a ver que es muy poco probable que se alcance la cantidad de sucesivas "1" llegamos.
De hecho, la probabilidad de que esto NO es igual a todas las demás secuencias, ya que estamos viendo la cantidad de éxitos con la distribución binomial. En realidad el hecho de que el "1" se successsive no importa para nosotros. El orden no importa y por lo tanto la probabilidad de que una secuencia no importa.
Una distribución binomial con p=0.5 tendrá el suceso más probable que hay muchas cabezas como hay colas. Así, donde en 15 lanza la mayoría de "espera" el resultado es de 7,5:
Binomial

De esta manera, podríamos con bastante precisión negar la hipótesis de que la moneda es justo y no habría ninguna falacia mediante una simple prueba binomial. http://en.wikipedia.org/wiki/Binomial_test

Su confusión parece provienen de la suposición de que estamos probando y no el importe de los jefes, sino más bien la secuencia. En este caso sería a la derecha: Cada secuencia es igualmente probable. Pero hay muchas más de estas secuencias que generan k lanza con "1" si k es menor que n, por lo que con nuestra feria de la moneda podemos asumir que tenemos, nuestra serie de sólo "1" es poco probable, precisamente PORQUE todas las proyecciones tienen la misma probabilidad de ir a "1" o "0"

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X