5 votos

La estimación de un valor de p cuando no se puede calcular que para el conjunto

Tengo dos listas de gran tamaño y quiero calcular el valor de p que son similares. El algoritmo de similitud es una caja negra, pero para esta aplicación vamos a confiar en él da exacta p-valores. Mi problema es que mi lista es demasiado grande y el algoritmo no dan respuestas para ellos. Sin embargo, creo que si me tome una pequeña muestra aleatoria de cada lista el algoritmo dará un p-valor. ¿Está permitido al azar de la muestra tanto en las listas de un gran número de veces y media el valor de p?

Debo al azar de la muestra, con o sin reemplazo?

4voto

Berek Bryan Puntos 349

No es correcto al azar de la muestra tanto en las listas de un gran número de veces y el promedio de los valores de p, el resultado sería subestimar la evidencia contra la hipótesis nula si el valor es falso, como usted, a continuación, esperar que el p-valor más pequeño como el tamaño de la muestra se hace más grande, pero con este procedimiento sería la misma estancia, en promedio.

En lugar de eso me gustaría sugerir el uso de Fisher combinado de la probabilidad de la prueba a combinar los p-valores. Esto supone que los p-valores que surgen de pruebas independientes, por lo que desea para el muestreo sin reemplazo, de manera que cada valor de la lista sólo se produce en una muestra. De forma equivalente al azar en el orden de ambas listas, a continuación, dividir en adecuado-trozos del tamaño de fuente en su caja negra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X