Si he entendido bien su experimento, parece que está interesado en encontrar el efecto de dos métodos de visualización diferentes sobre algún resultado de visualización, en cuatro grupos definidos por diferentes géneros y carreras universitarias. Si es así, las variables son las siguientes:
$$\begin{equation} \begin{aligned} \text{Response variable} & & = & \quad \text{Visualisation outcome,} \\[6pt] \text{Treatment variable} & & = & \quad \text{Visualisation method (A/B),}\\[6pt] \text{Covariates} & & = & \quad \text{Gender (F/M) + Major (STEM/Art)}. \\[6pt] \end{aligned} \end{equation}$$
Dado que su objetivo es encontrar el efecto de la variable de tratamiento, ésta es la que debe aleatorizar. En este caso, puede utilizar fácilmente aleatorización por bloques sobre los cuatro bloques definidos por sus covariables. En cada uno de estos bloques hay cinco personas. Dentro de cada bloque, asigne aleatoriamente un número determinado de personas a los grupos de tratamiento (por ejemplo, el método de visualización A) y mantenga al resto de personas en el grupo de control (por ejemplo, el método de visualización B). Dado que esta variable se asigna aleatoriamente, es estadísticamente independiente de las covariables y de cualquier posible variable oculta, por lo que podrá realizar una inferencia causal sobre su efecto en la variable de respuesta. Al utilizar la aleatorización por bloques, también se asegura de que la aleatorización tenderá a producir un vector de tratamiento más cercano a la ortogonalidad con respecto a las covariables, reduciendo así la varianza en el análisis de regresión posterior. Tampoco tiene que preocuparse por los colisionadores en este análisis, ya que el sexo y la carrera universitaria no se ven afectados causalmente por el tratamiento o la respuesta.
Aquí hay dos cuestiones que deben disociarse. La primera es el requisito de aleatorización para la inferencia causal en un experimento. La segunda es el requisito del muestreo aleatorio para la inferencia sobre una población más amplia. Merece la pena señalar que si la variable de tratamiento es el método de visualización, la aleatorización de esta variable permite la inferencia causal, pero la inferencia sigue limitada al marco de muestreo. En otras palabras, siempre que se aleatorice la variable de tratamiento, se puede inferir legítimamente el efecto de esta variable. para la población de personas correspondiente a su método de muestreo no aleatorio . Hable de esto con su asesor para ver qué es lo que quiere que usted deduzca. Si quiere que haga una inferencia sobre el conjunto de los estudiantes universitarios, entonces sería apropiado utilizar un método de muestreo aleatorio para tomar una muestra de esta población.