En el transcurso de 30 días me han preguntado 47 personas (24 de grupo a y 23 del grupo B) que de las cuatro comidas que prefieren, haciendo un total de 1410 observaciones:
choice
group apple orange pizza beer
A 340 63 216 101
B 424 65 125 76
Porque he preguntado a la misma persona varias veces, las observaciones (dentro de cada grupo) no son independientes y no se puede usar una prueba de chi-cuadrado para comparar las distribuciones.
Lo que quiero saber es: Que los alimentos son elegidos significativamente más a menudo por un grupo que en el otro? Mi hipótesis es que el grupo prefiere la pizza y la cerveza, mientras que el grupo B prefiere las frutas. Supongo que la preferencia no cambia a lo largo (corto) tiempo y no, no estoy interesado en la longitudinal aspecto de la encuesta.
Prueba de lo que puedo usar?
Intento de solución:
Básicamente, las medidas repetidas (de la misma persona) son algo así como repetidamente la medición de la longitud de un palo para obtener una medición más exacta y el promedio de los errores de medición. Por eso pensé que, para cada persona con la que me podría calcular el porcentaje de cada categoría de respuesta. Por lo tanto, el 100% de las respuestas de una persona, a continuación, se dividen en, por ejemplo, el 40% de apple respuestas, el 30% de naranja, el 20% de la pizza, y el 10% de la cerveza. Representado como probabilidades (que suma hasta 1 de cada persona), me permitiría tener datos como esto:
person group apple orange pizza beer
1 A 0.4 0.3 0.2 0.1
2 B ...
De esta manera, me habría "eliminado" de la en-persona interdependencia y después de realizar una prueba t en la resultante de dos vectores numéricos.
Pero soy incapaz de juzgar si esto es un procedimiento válido para el tipo de datos que tengo. También, me gustaría usar una publicados y revisados de la prueba, en el caso de que exista.
Datos de ejemplo:
food <- c("apple", "orange", "pizza", "beer")
dat <- data.frame(
group = rep(c("A", "B"), c(720, 690)),
choice = c(
rep(food, c(340, 63, 216, 101)),
rep(food, c(424, 65, 125, 76))
)
)
tab <- table(dat)