Durante el diseño de mis experimentos me encontré con la siguiente pregunta: Al hacer un ajuste lineal (mínimos cuadrados), ¿tiene más sentido tener más categorías o más observaciones por categoría? En otras palabras: ¿qué es lo que dará mayor confianza al ajuste? La imagen siguiente ilustra mis opciones (no son datos reales).
Antecedentes:
Durante el experimento voy a hacer un Ley de Fitt experimento. Aquí pediré a los usuarios que muevan el cursor del ratón desde una posición específica hasta un objetivo. Este objetivo tiene un tamaño específico (W) y está posicionado a cierta distancia (D) de la posición inicial.
La ley de Fitt establece que la dificultad de esta tarea (Índice de Dificultad (ID)) puede recogerse en la siguiente fórmula:
$\mathrm{ID}=\log _{2}\left(\frac{2 D}{W}\right)$
El tiempo medio que se tarda en desplazarse hacia el objetivo (tiempo de movimiento (TM)) puede ser capturado por una relación lineal:
$\mathrm{MT}=a+b \cdot \mathrm{ID}$
Diseño del experimento
Durante el experimento con un participante tengo una cantidad finita de tiempo y puedo elegir hacer una pequeña cantidad de identificaciones con muchas repeticiones por identificación o un montón de identificaciones diferentes con menos repeticiones por identificación. Digamos que el número total de ensayos por participante es fijo, ¿cuál sería mi mejor opción? ¿Cambia esto los valores de R^2? ¿Y qué dará la mayor confianza del ajuste?