EDIT 1: Gracias a @gung por señalar que si la bolsa inicialmente había 324 dulces, y luego como Madre de las manos, hay consecutivamente menos cantidades ella puede entregar. Para simplificar las cosas (porque estoy interesado en la comprensión de los conceptos básicos en lugar de algo demasiado avanzado), ofreció un cambio en la redacción.
EDIT 2: Esto no es la tarea. Sólo estoy tratando de aprender algunas estadísticas de una manera divertida
COMENTARIO: todos los amables comentarios/respuestas hasta ahora, se me ocurre que realmente necesito para trabajar en la definición de mis preguntas en el futuro mucho mejor porque me di cuenta de cuánto la respuesta podría variar dependiendo de cómo se plantea (muy útil lección!). Yo al principio pensaba que esto estaba bien planteado, pero es bueno aprender estas cosas y esperemos que mejore, gracias.
Digamos que una madre tiene una bolsa que contiene un número infinito de dulces.
Mantenemos un seguimiento de la cantidad de dulces que se le dé a cada uno de sus hijos llamado "A", "B", ..., "G" de esta bolsa, y cómo muchos de los que ella da a un desconocido número de adultos. Cuando la madre llega a cada persona, ella se abre una nueva, idéntica bolsa de dulces, alcanza y agarra unas para ese individuo. Al final del día, ella se ha dado un total de 324 dulces!
> (DF <- data.frame(A=15, B=4, C=1, D=4, E=44, F=4, G=1, Adults=251, Total=324))
A B C D E F G Adults Total
15 4 1 4 44 4 1 251 324
Pregunta 1: a Sus hijos dieron un total de 73 dulces de los 324. Los adultos se dan 251 dulces de los 324. Que los niños quieren saber si los adultos que recibieron una diferencia estadísticamente significativa proporción de los dulces a pesar de que su madre afirma que todos tenían la misma oportunidad de obtener el mismo número de caramelos y fue solo suerte que tengo algunos más que otros. Así que, básicamente, queremos comparar el todo el grupo de niños contra el todo el grupo de los adultos, no a los individuos.
Pregunta 2: ¿uno o más de los niños obtener un número estadísticamente significativo de los más dulces cuando en comparación con sus hermanos (es decir, ignoramos los Adultos para esta pregunta, y considerar sólo los niños "", ..., "G")? Y si es así, que uno(s) obtuvo una diferencia estadísticamente significativa proporción? Madre de nuevo las reclamaciones que todos tienen la misma oportunidad de obtener el mismo número de caramelos, y fue solo suerte que tengo algunos más que otros.
Información adicional: quiero usar un arranque de enfoque porque me parece a obtener una mejor idea de la probabilidad de que al uso de la simulación (NB: no soy un estadístico, sólo haciendo esto por diversión). A continuación voy a dar mi enfoque a la primera pregunta que creo que está bien, pero agradecería algún consejo sobre si lo estoy haciendo correctamente. No tengo idea de cómo acercarse a la segunda pregunta porque hay varias proporciones involucrados.
Mi enfoque de la Pregunta Uno:
Hipótesis: Mi hipótesis nula es que los niños y los adultos tenían la misma probabilidad de obtener el mismo número de caramelos. Mi hipótesis alternativa es que la Madre es más generoso con la entrega de dulces a los adultos que a sus hijos.
Pregunta de investigación: ¿Cómo a menudo podemos observar una proporción de dulces tan pequeños como los niños se, si la madre realmente estaba repartiendo dulces justa?
Metodología: se puede probar de manera directa mediante la creación de una población hipotética que encarna la hipótesis nula, con un 50% de "niños" y 50% "adultos" y dibujo repetidamente muestras aleatorias de 324 a partir de ella, con la sustitución, el registro de los resultados. Entonces observamos cómo muchas de estas muestras tiene 73 o menos "niños" nodos en ellos (esta es nuestra p-valor).
replicates <- 999
size <- 324
runs <- list(replicates)
reference <- 73/size
for(i in 1:replicates){
runs[[i]] <- table(sample(x=c("children", "adult"), size=size, replace=TRUE, prob=c(0.5, 0.5)))
}
bootstraps <- as.data.frame(do.call(rbind, runs))
# adult children
# 1 166 158
# 2 171 153
# 3 158 166
# 4 151 173
# 5 156 168
# etc.
sum(bootstraps$children <= reference) / replicates
#[1] 0
Conclusión: Mi p-valor es efectivamente cero, lo que significa que hay una fuerte evidencia de que la Madre ha estado repartiendo dulces injustamente porque conseguir 73 o menos dulces es muy poco probable que haya ocurrido por suerte en solitario.
Como para la pregunta 2, estoy dibujando un completo espacio en blanco :(