La mejor manera de plantear mi pregunta es con un ejemplo.
Supongamos que realizamos un experimento diseñado para medir cómo influyen tres fertilizantes diferentes en la longitud de los tallos de los girasoles, y repetimos el experimento cinco veces (es decir, tratamos cinco girasoles distintos con el fertilizante 1, luego otros cinco girasoles distintos con el fertilizante 2 y así sucesivamente).
La mejor manera de evaluar el efecto del tipo de fertilizante es, obviamente, mediante un modelo lineal general, es decir, un ANOVA. Supongamos que ajustamos nuestro modelo y obtenemos un $R^2$ valor de $0.91$ . Por supuesto, este es un valor bastante alto.
Supongamos que la obtención de esas 5 muestras fue increíblemente difícil, por lo que quisimos facilitar la vida de los futuros experimentadores elaborando un intervalo de confianza para el verdadero $R^2$ valor.
¿Sería apropiado utilizar técnicas de bootstrapping en los datos experimentales para generar una distribución de muestreo para la $R^2$ ¿valor?