Estoy llevando a cabo un experimento para comparar los 4 tipos de audífonos. Estoy interesado en saber si los auriculares se diferencian en su calidad subjetiva.
Treinta sujetos escucharon cada par de auriculares varias veces y calificación de los audífonos de calidad. Mi variable dependiente es la calidad de sonido, y mis dos variables independientes son auriculares de tipo (3 tipos) y sujeto (30 sujetos). Para cada uno de los auriculares, sujeto combinación, he recopilado 12 calificaciones (12 repeticiones).
Un anova de dos vías elaborado la siguiente tabla. Se muestra un significativo efecto de la interacción entre los auriculares y el sujeto. Esto parece indicar que los sujetos no están de acuerdo en sus índices de popularidad de los auriculares.
Df Sum Sq Mean Sq F value Pr(>F)
headphone 2 2933 1466 4.116 0.0165 *
subject 29 165500 5707 16.022 < 2e-16 ***
headphone:subject 58 46897 809 2.270 3.24e-07 ***
Residuals 1350 480869 356
Un examen de los datos mostró que muchos sujetos no pudo distinguir entre los auriculares. Es decir, las calificaciones de la calidad que le dieron a cada no parecen diferentes el uno del otro. El siguiente gráfico, por ejemplo, muestra los datos de cinco sujetos. Las medianas (líneas rojas) parecen casi iguales para los temas 1 y 5.
La siguiente pregunta que me gustaría responder es "¿cuántos de los 30 sujetos de forma fiable puede discriminar entre los 3 tipos de audífonos". O, en términos estadísticos, "¿para cuántas asignaturas puedo rechazar la hipótesis nula de que la media de las calificaciones son iguales".
Mi primer instinto para responder a esta pregunta era para ejecutar un anova de una vía en cada sujeto (IV, tipo de auriculares), y rechazar la nula si $p$ estaba por debajo de mi $\alpha$ (0.05). En más de reflexión, me di cuenta de que este enfoque me iba a dar muchos falsos positivos: algunos temas, sería probable que el rendimiento de $p < 0.05$ sólo por azar.
Si quiero determinar cuántas asignaturas puede discriminar entre los auriculares, debo usar ajustar los valores de p para estos 30 el análisis de la varianza? (I. e. debo ajustar el $p$s a la dirección de la el problema de las comparaciones múltiples utilizando, por ejemplo, Holm-corrección de Bonferroni?)