Me parece que la precisión de la clasificación del bosque aleatorio cambios en el modelo, cuando la secuencia de las variables de entrada del cambio.
E. g.
set.seed(143)
artCheck.forest<-randomForest(GoodArt.check~Brush+Min.Guarantee.Cost+Top.3.artists+Brush.Size+Brush.Finesse+Art.Nationality+Art.Type, data=noYes,imp=T,type='classification')
La matriz de confusión es
NO YES class.error
NO 84 12 0.1250000
YES 15 47 0.2419355
Cuando el "Cepillo" variable se mueve a una posición diferente, dicen
set.seed(143)
artCheck.forest<-randomForest(GoodArt.check~Min.Guarantee.Cost+Top.3.artists+Brush+Brush.Size+Brush.Finesse+Art.Nationality+Art.Type, data=noYes,imp=T,type='classification')
La matriz de confusión se convierte en
NO YES class.error
NO 83 13 0.13541667
YES 5 57 0.08064516
La secuencia de los nombres de las variables en el dataframe es como sigue :
1 Art Auction House
2 IsGood Purchase
3 Critic Ratings
4 Buyer No
5 Zip Code
6 Art Purchase Date
7 Year of art piece
8 Acq Cost
9 Art Category
10 Size
11 Length
12 Width
13 SizeRatio
14 Border of art piece
15 Art Type
16 Prominent Color
17 CurrentAuctionAveragePrice
18 Premium
19 Brush
20 Brush Size
21 Brush Finesse
22 Art Nationality
23 Top 3 artists
24 CollectorsAverageprice
25 Profit
26 GoodArt check
27 AuctionHouseGuarantee
28 Vnst
29 Is It Online Sale
30 Min Guarantee Cost