Tengo un conjunto de datos que es desequilibrada y le da peso a las muestras para compensar, sin embargo no puedo encontrar el código para implementar esto en R aunque creo que es una característica en el randomForest
paquete para ello.
Aquí es un conjunto de datos de muestra:
id buy=1/noBuy=0 timeOnSite(sec.) clicksOnSite estAge
1 0 150 12 44
2 0 342 56 23
3 0 33 11 18
4 1 167 34 27
5 0 95 3 52
6 0 254 98 26
7 0 982 4 36
8 0 72 6 22
9 1 259 62 48
10 0 438 104 24
...
Estoy tratando de predecir la columna Compro/noBuy pero los datos reales están aún más desequilibrados que esto. ¿Alguien sabe de un ejemplo escrito en R para hacer frente a una situación similar?