Digamos que tengo un amigo (vamos a llamarlo "George") que dice que él puede controlar a la tirada de dados con su mente (es decir, hacer los dados más probable es que se caiga en un número específico está pensando).
¿Cómo puedo diseñar una científicamente riguroso examen para determinar si se puede hacer esto? (La verdad creo que no se puede, por supuesto, pero yo quiero que él se acuerda de los detalles de una prueba, el Asombroso Randi-estilo, antes de que comience la prueba.) Quiero reducir el (muy probable) la prueba post-excusas que él va a venir para arriba con.
Aquí es lo que tengo hasta ahora:
Determinar la física de los dados-técnica de laminación (que dados, la coctelera de la copa, la superficie de aterrizaje, etc)
Definir una "sesión de prueba", que consta de X tiradas de los dados. Este debe ser lo suficientemente pequeño como para hacerlo en una sola sesión, pero lo suficientemente grande como para determinar tras el análisis, dentro de un 95%-99% de confianza si los dados cayeron justo, o favorecido a un lado
Ejecutar Y sesiones en la elección de dados (sin la influencia de George), como un "control" para asegurarse de que los dados muestran "justa" de los resultados en sus propios
Ejecutar Z sesiones con George. Antes de cada rollo por separado un dado para determinar qué número de George se "concentran" durante toda la sesión.
Compilar y analizar los resultados.
George hace algunas excusas por su pésimo desempeño.
Así que mi pregunta para usted:
Los defectos o problemas con mi metodología global? Nada de George es probable que el objeto a?
Debo usar un D6? O un D20? ¿Importa? Sería un dado con las caras más requieren más rollos para producir de manera similar la confianza de los resultados? O todo lo contrario? Prefiero menos rollos de más, debido a consideraciones prácticas :)
¿Cuáles son razonables los valores de X, Yy Z? Ellos no son totalmente independientes; si mi elegido valor de X sólo permite de confianza del 95% para una sola sesión, a continuación, 1 de cada 20 sesiones puede "fallar", incluso sin la influencia de George
¿Cómo puedo definir el "éxito" o "fracaso" para una sesión individual? (Me hizo encontrar a esta pregunta , que pasa a través de los detalles de una prueba de chi-cuadrado, así que creo que es mi metodología de evaluación, pero lo que son una confianza razonable de los umbrales?)
¿Cómo puedo definir el "éxito" o "fracaso" para el global de la prueba? George podría "ganar" una sola sesión por pura casualidad, pero ¿cuántos de los Z sesiones tendría que pasar para pasar la totalidad de la prueba?
Probablemente voy a ser el análisis de estos resultados en una hoja de cálculo MS Excel, si eso hace la diferencia.