5 votos

¿Cómo utilizar pesos para datos desequilibrados en R ' s randomForest?

Tengo un conjunto de datos que es desequilibrada y le da peso a las muestras para compensar, sin embargo no puedo encontrar el código para implementar esto en R aunque creo que es una característica en el randomForest paquete para ello.

Aquí es un conjunto de datos de muestra:

id      buy=1/noBuy=0    timeOnSite(sec.)     clicksOnSite      estAge
1             0              150                   12             44
2             0              342                   56             23
3             0               33                   11             18
4             1              167                   34             27
5             0               95                    3             52
6             0              254                   98             26
7             0              982                    4             36
8             0               72                    6             22
9             1              259                   62             48
10            0              438                  104             24
...

Estoy tratando de predecir la columna Compro/noBuy pero los datos reales están aún más desequilibrados que esto. ¿Alguien sabe de un ejemplo escrito en R para hacer frente a una situación similar?

4voto

Carsten Thiel Puntos 751

OK, encontre parte de mi respuesta pero no la parte buena. Resulta que el randomForest paquete puede hacer un muestreo estratificado pero sólo para la clasificación. Aquí hay un enlace a la explicación del autor de paquete.

Todavía estoy buscando ideas sobre cómo hacer un muestreo estratificado para regresión rf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X