Me llamo Abhi y estoy tratando de entender la diferencia entre predecir y pronosticar.
Estoy usando el lenguaje r y mi ide es rstudio. He creado un modelo de bosque aleatorio (paquete r randomForest)
myModel <- randomForest(Survived ~ .,data = modelData[,-1],importance = T)
modelResponses = predict(model,type = "prob") # I am guessing this gives probability of survival for each passenger
temp1 = modelResponses[,2]
pred = prediction(temp1,trainData$Survived) #Not Sure whats is the pred object
Aquí están mis preguntas
- ¿Qué es el objeto pred?
- He visto algún código que utiliza el objeto pred para trazar la curva auc. Sé que temp1 es la probabilidad de supervivencia de cada registro. Digamos que la probabilidad de supervivencia de un registro concreto es de 0,55. ¿Cómo sabe la función de predicción clasificar esto como sobrevivido o no sobrevivido?
- ¿Cómo puedo utilizar este modelo para clasificar nuevos datos? Hasta ahora estaba usando
modelResponses = predict(model,type = "prob")
pero ahora no estoy tan seguro. De nuevo la misma confusión que el punto 2, cómo determina el sistema el mejor punto de corte para las probabilidades.
Muchas gracias chicos. Cualquier ayuda será muy apreciada.
Saludos,