87 votos

Reglas generales sobre el tamaño mínimo de la muestra para la regresión múltiple

En el contexto de una propuesta de investigación en ciencias sociales, se me planteó la siguiente pregunta:

Siempre he ido por 100 + m (donde m es el número de predictores) cuando determinar el tamaño mínimo de la muestra para regresión múltiple. ¿Es esto apropiado?

Recibo muchas preguntas similares, a menudo con diferentes reglas empíricas. También he leído muchas veces esas reglas empíricas en varios libros de texto. A veces me pregunto si la popularidad de una regla en términos de citas se basa en lo baja que es la norma. Sin embargo, también soy consciente del valor de una buena heurística para simplificar la toma de decisiones.

Preguntas:

  • ¿Cuál es la utilidad de las reglas empíricas simples sobre el tamaño mínimo de las muestras en el contexto de los investigadores aplicados que diseñan estudios de investigación?
  • ¿Podría sugerir una regla general alternativa para el tamaño mínimo de la muestra para la regresión múltiple?
  • Alternativamente, ¿qué estrategias alternativas sugeriría para determinar el tamaño mínimo de la muestra para la regresión múltiple? En particular, sería bueno que se asignara un valor al grado en que cualquier estrategia puede ser aplicada fácilmente por un no estadístico.

43voto

Eric Davis Puntos 1542

No soy partidario de las fórmulas simples para generar tamaños mínimos de muestra. Como mínimo, cualquier fórmula debería tener en cuenta el tamaño del efecto y las cuestiones de interés. Y la diferencia entre ambos lados de un corte es mínima.

El tamaño de la muestra como problema de optimización

  • Las muestras más grandes son mejores.
  • El tamaño de la muestra suele estar determinado por consideraciones pragmáticas.
  • El tamaño de la muestra debe considerarse como una de las consideraciones de un problema de optimización en el que el coste en tiempo, dinero, esfuerzo, etc. de obtener más participantes se sopesa frente a los beneficios de tener más participantes.

Una regla general

En términos de reglas generales dentro del contexto típico de los estudios psicológicos de observación que implican cosas como pruebas de capacidad, escalas de actitud, medidas de personalidad, etc., a veces pienso en:

  • n=100 como adecuado
  • n=200 como bueno
  • n=400+ como gran

Estas reglas empíricas se basan en los intervalos de confianza del 95% asociados a las correlaciones en estos niveles respectivos y en el grado de precisión con el que me gustaría entender teóricamente las relaciones de interés. Sin embargo, se trata sólo de una heurística.

G Power 3

La regresión múltiple pone a prueba múltiples hipótesis

  • Cualquier cuestión de análisis de potencia requiere la consideración de los tamaños de los efectos.

  • El análisis de potencia para la regresión múltiple se complica por el hecho de que hay múltiples efectos, incluido el cuadrado r global y uno para cada coeficiente individual. Además, la mayoría de los estudios incluyen más de una regresión múltiple. Para mí, esta es una razón más para confiar más en la heurística general y pensar en el tamaño mínimo del efecto que se quiere detectar.

  • En relación con la regresión múltiple, suelo pensar más en el grado de precisión en la estimación de la matriz de correlación subyacente.

Precisión en la estimación de parámetros

También me gusta la discusión de Ken Kelley y sus colegas sobre la precisión en la estimación de parámetros.

  • Ver Sitio web de Ken Kelley para publicaciones
  • Como menciona @Dmitrij, Kelley y Maxwell (2003) PDF GRATUITO un artículo útil.
  • Ken Kelley desarrolló el MBESS en R para realizar análisis que relacionen el tamaño de la muestra con la precisión en la estimación de parámetros.

24voto

dan90266 Puntos 609

No prefiero pensar en esto como una cuestión de poder, sino más bien plantear la pregunta "¿cómo de grande debe ser? $n$ sea para que la aparente $R^2$ ¿se puede confiar? Una forma de enfocarlo es considerar la proporción o diferencia entre $R^2$ y $R_{adj}^{2}$ siendo este último el ajustado $R^2$ dado por $1 - (1 - R^{2})\frac{n-1}{n-p-1}$ y formar una estimación más imparcial de la "verdadera" $R^2$ .

Se puede utilizar algún código R para resolver el factor de $p$ que $n-1$ debe ser tal que $R_{adj}^{2}$ es sólo un factor $k$ más pequeño que $R^2$ o sólo es menor por $k$ .

require(Hmisc)
dop <- function(k, type) {
  z <- list()
  R2 <- seq(.01, .99, by=.01)
  for(a in k) z[[as.character(a)]] <-
    list(R2=R2, pfact=if(type=='relative') ((1/R2) - a) / (1 - a) else
         (1 - R2 + a) /  a)
  labcurve(z, pl=TRUE, ylim=c(0,100), adj=0, offset=3,
           xlab=expression(R^2), ylab=expression(paste('Multiple of ',p)))
}
par(mfrow=c(1,2))
dop(c(.9, .95, .975), 'relative')
dop(c(.075, .05, .04, .025, .02, .01), 'absolute')

enter image description here Leyenda: Degradación en $R^{2}$ que logra un descenso relativo de $R^{2}$ a $R^{2}_{adj}$ por un factor relativo indicado (panel de la izquierda, 3 factores) o una diferencia absoluta (panel de la derecha, 6 decrementos).

Si alguien ha visto esto ya impreso, por favor, hágamelo saber.

13voto

Mike Moore Puntos 641

(+1) por una cuestión, en mi opinión, crucial.

En la macroeconometría suele haber tamaños de muestra mucho más pequeños que en los experimentos micro, financieros o sociológicos. Un investigador se siente bastante bien cuando puede proporcionar estimaciones al menos factibles. Mi regla personal de lo menos posible es $4\cdot m$ ( $4$ grados de libertad en un parámetro estimado). En otros campos de estudio aplicados se suele tener más suerte con los datos (si no es demasiado caro, basta con recoger más puntos de datos) y cabe preguntarse cuál es el tamaño óptimo de una muestra (no sólo el valor mínimo de la misma). Esta última cuestión proviene del hecho de que más datos de baja calidad (con ruido) no es mejor que una muestra más pequeña de alta calidad.

La mayoría de los tamaños de muestra están relacionados con la potencia de las pruebas para la hipótesis que se va a probar después de ajustar el modelo de regresión múltiple.

Hay un bonito calculadora que podría ser útil para los modelos de regresión múltiple y algunos fórmula entre bastidores. Creo que una calculadora de este tipo puede ser aplicada fácilmente por personas que no sean estadísticos.

Probablemente K.Kelley y S.E.Maxwell artículo puede ser útil para responder a las otras preguntas, pero primero necesito más tiempo para estudiar el problema.

12voto

patfla Puntos 1

Su regla general no es particularmente buena si $m$ es muy grande. Tome $m=500$ su regla dice que está bien encajar $500$ variables con sólo $600$ observaciones. No lo creo.

En el caso de la regresión múltiple, hay una teoría que sugiere un tamaño mínimo de muestra. Si va a utilizar los mínimos cuadrados ordinarios, uno de los supuestos que requiere es que los "verdaderos residuos" sean independientes. Ahora bien, cuando se ajusta un modelo de mínimos cuadrados a $m$ variables, está imponiendo $m+1$ restricciones lineales en sus residuos empíricos (dados por los mínimos cuadrados o ecuaciones "normales"). Esto implica que los residuos empíricos no son independientes - una vez que sabemos $n-m-1$ de ellos, el resto $m+1$ se puede deducir, donde $n$ es el tamaño de la muestra. Por lo tanto, tenemos una violación de este supuesto. Ahora el orden de la dependencia es $O\left(\frac{m+1}{n}\right)$ . Por lo tanto, si elige $n=k(m+1)$ para algún número $k$ entonces el orden viene dado por $O\left(\frac{1}{k}\right)$ . Por lo tanto, al elegir $k$ estás eligiendo cuánta dependencia estás dispuesto a tolerar. Yo elijo $k$ de la misma manera que para aplicar el "teorema del límite central" - $10-20$ es bueno, y tenemos la regla del "recuento de estadísticas" $30\equiv\infty$ (es decir, el sistema de recuento del estadístico es $1,2,\dots,26,27,28,29,\infty$ ).

9voto

Arnaud Meuret Puntos 115

En Psicología:

Green (1991) indica que $N > 50 + 8m$ (donde m es el número de variables independientes) es necesario para probar la correlación múltiple y $N > 104 + m$ para probar los predictores individuales.

Otras reglas que se pueden utilizar son...

Harris (1985) dice que el número de participantes debe superar el número de predictores en al menos $50$ .

Van Voorhis & Morgan (2007) ( pdf ) utilizando 6 o más predictores el mínimo absoluto de participantes debe ser $10$ . Aunque es mejor optar por $30$ participantes por variable.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X