¿Es posible controlar el coste de la clasificación errónea en el paquete R randomForest ?
En mi propio trabajo, los falsos negativos (por ejemplo, omitir por error que una persona puede tener una enfermedad) son mucho más costosos que los falsos positivos. El paquete rparte permite al usuario controlar los costes de clasificación errónea especificando una matriz de pérdidas para ponderar las clasificaciones erróneas de forma diferente. ¿Existe algo similar para randomForest
? ¿Debo, por ejemplo, utilizar el classwt
para controlar el criterio de Gini?