¿Cómo utilizar pesos para datos desequilibrados en R ' s randomForest?

Question

¿Cómo utilizar pesos para datos desequilibrados en R ' s randomForest?

Preguntado el 5 de Febrero, 2012: Cuando se hizo la pregunta
5042 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo un conjunto de datos que es desequilibrada y le da peso a las muestras para compensar, sin embargo no puedo encontrar el código para implementar esto en R aunque creo que es una característica en el randomForest paquete para ello.

Aquí es un conjunto de datos de muestra:

id      buy=1/noBuy=0    timeOnSite(sec.)     clicksOnSite      estAge
1             0              150                   12             44
2             0              342                   56             23
3             0               33                   11             18
4             1              167                   34             27
5             0               95                    3             52
6             0              254                   98             26
7             0              982                    4             36
8             0               72                    6             22
9             1              259                   62             48
10            0              438                  104             24
...

Estoy tratando de predecir la columna Compro/noBuy pero los datos reales están aún más desequilibrados que esto. ¿Alguien sabe de un ejemplo escrito en R para hacer frente a una situación similar?

Preguntado el 5 de Febrero, 2012 por Carsten Thiel

Answer 1

1 Respuestas

Answer 2

4voto

Carsten Thiel Puntos 751

OK, encontre parte de mi respuesta pero no la parte buena. Resulta que el randomForest paquete puede hacer un muestreo estratificado pero sólo para la clasificación. Aquí hay un enlace a la explicación del autor de paquete.

Todavía estoy buscando ideas sobre cómo hacer un muestreo estratificado para regresión rf

Respondido el 7 de Febrero, 2012 por Carsten Thiel (751 Puntos )

¿Cómo utilizar pesos para datos desequilibrados en R ' s randomForest?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cómo utilizar pesos para datos desequilibrados en R ' s randomForest?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: