12 votos

¿Por qué toma R un largo tiempo para adaptarse a un modelo con un nivel de factor?

Yo se ajustan a un modelo con un factor con muchos niveles y toma R un tiempo muy largo para encajar en ese modelo. ¿Por qué es esto?

Por ejemplo, si el ajuste de una regresión para predecir los sueldos, e incluyen un factor predictor para todos los jugadores de las respectivas nacionalidades, que iba a tomar un tiempo más largo que el ajuste de un modelo para los sueldos con un predictor continuo, como el de los jugadores alturas.

14voto

AdamSane Puntos 1825

R es típico - como la mayoría de las estadísticas de los paquetes, se utiliza la descomposición QR para la regresión.

Fijo $n$ donde $p<<n$, sólo el cálculo de la descomposición en sí efectivamente es cuadrática en $p$ - duplicar el número de predictores se multiplica el tiempo de cálculo por alrededor de 4.

Así que si usted va de $p=2$ (regresión lineal) para decir $p=50$, que puede esperar que para tomar algo en la región de 600 veces más (en la actualidad probablemente algo menos, por una variedad de razones).

Así que la adición de un montón de factores va a significar mucho más tiempo de espera.

7voto

anand Puntos 199

Eso es porque con un factor de $k$ niveles, R crea $k-1$ indicador variables. Así, supongamos que hay $k=50$ nacionalidades, que son el ajuste de un modelo de regresión múltiple con $49$ predictores, en comparación con una regresión lineal simple si te tratan como continuo (que no debería). Tal vez usted podría crear un nuevo factor que es el continente o algún otro más grueso de la agrupación de las nacionalidades, así como para acelerar las cosas y disfrutar de un modelo parsimonioso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X