La "correlación múltiple" es la raíz cuadrada positiva del modelo de regresión múltiple de $R^2$ . La "correlación parcial" se refiere a un coeficiente específico dentro de ese modelo. Dado que desea verificar un coeficiente preespecificado, desea este último (es decir, $N ≥104 + m$ ).
Sin embargo, estas reglas empíricas se refieren a tamaños de muestra mínimos para garantizar que el modelo no se está "acercando a la saturación", lo que no es necesariamente su principal preocupación. Como alguien dijo una vez, "la mejor regla empírica es desconfiar de las reglas empíricas".
Un enfoque mejor sería realizar un análisis de potencia. En concreto, se trata de realizar un análisis de sensibilidad o un análisis de potencia de tipo post-hoc. Es decir, dado el tamaño de la muestra, cuál es la correlación más pequeña que tendría su nivel preferido de potencia (a menudo el 80%) para detectar (s), o cuál sería su potencia para detectar su correlación preferida (ph). En primer lugar, reste $1$ de su $N$ por cada grado de libertad que consumirán tus covariables, fija alfa en, oh, no sé, digamos, $.05$ y resolver la correlación estipulando un nivel de potencia, o resolver la potencia estipulando una correlación. Es posible que su análisis no merezca la pena, aunque su $N$ supera la regla general, o que es probable que esté bien, incluso si su $N$ no supera la regla general.