2016-04-27 6 views
3

Mit dem berühmten Iris-Datensatz mit Julia Entscheidungsbaum Klassifizierer bekomme ich den folgenden Baum. oder "virginica: 3/3":Erklären der Zahlen in einem Entscheidungsbaum

using RDatasets 
using DecisionTree 
iris = dataset("datasets", "iris") 
features = convert(Array, iris[:, 1:4]) 
labels = convert(Array, iris[:, 5]); 
model = build_tree(labels, features) 
model = prune_tree(model, 0.9) 

print_tree(model) 
Feature 3, Threshold 3.0 
L-> setosa : 50/50 
R-> Feature 4, Threshold 1.8 
    L-> Feature 3, Threshold 5.0 
     L-> versicolor : 47/48 
     R-> Feature 4, Threshold 1.6 
      L-> virginica : 3/3 
      R-> Feature 1, Threshold 7.2 
       L-> versicolor : 2/2 
       R-> virginica : 1/1 
    R-> Feature 3, Threshold 4.9 
     L-> Feature 1, Threshold 6.0 
      L-> versicolor : 1/1 
      R-> virginica : 2/2 
     R-> virginica : 43/43 

Ich kann nicht wirklich die Zahlen nach einige der Zweige, wie "50/50 setosa" interpretieren.

Könnte jemand erklären, was diese bedeuten?

Antwort

1

Es sieht so aus auf Knoten "setosa: 50/50" 50 Blumen wurde korrekt klassifiziert (50 Blumen wurde in diesen Knoten und 50 sind Setosa) versicolor: 47/48 bedeutet, dass einer von ihnen virginica oder setosa ist .