Es ist möglich, Entscheidungsbäume mit pydotplus von pypi zu visualisieren, aber es hat Probleme auf meinem Rechner (es heißt, es wurde nicht mit libexpat gebaut und zeigt daher nur eine Zahl auf einem Knoten statt einer Tabelle mit einigen Informationen) und ich möchte eine Alternative verwenden. Ich habe bereits versucht, networkx zu verwenden, aber es erfordert pygraphviz, um .dot-Dateien zu lesen und einen networkx-Graph von ihnen zu machen. Als ich versuchte, es mit Pip zu installieren, das auch fehlschlug.sklearn.tree.export_graphviz Alternativen

Jetzt suche ich nach einer alternativen Möglichkeit, Entscheidungsbäume zu visualisieren, die mit Pip oder Anaconda installiert werden können.

Welche Alternativen gibt es?

EDIT # 1

SciPy Version: 0.17.0

digraph Tree { 
node [shape=box, style="filled", color="black"] ; 
0 [label="grade.B <= 0.5\ngini = 0.5\nsamples = 37224\nvalue = [18476, 18748]", fillcolor="#399de504"] ; 
1 [label="grade.C <= 0.5\ngini = 0.4973\nsamples = 32094\nvalue = [17218, 14876]", fillcolor="#e5813923"] ; 
0 -> 1 [labeldistance=2.5, labelangle=45, headlabel="True"] ; 
2 [label="gini = 0.4829\nsamples = 21728\nvalue = [12875, 8853]", fillcolor="#e5813950"] ; 
1 -> 2 ; 
3 [label="gini = 0.4869\nsamples = 10366\nvalue = [4343, 6023]", fillcolor="#399de547"] ; 
1 -> 3 ; 
4 [label="grade.A <= 14.8301\ngini = 0.3702\nsamples = 5130\nvalue = [1258, 3872]", fillcolor="#399de5ac"] ; 
0 -> 4 [labeldistance=2.5, labelangle=-45, headlabel="False"] ; 
5 [label="gini = 0.3555\nsamples = 4987\nvalue = [1153, 3834]", fillcolor="#399de5b2"] ; 
4 -> 5 ; 
6 [label="gini = 0.3902\nsamples = 143\nvalue = [105, 38]", fillcolor="#e58139a3"] ; 
4 -> 6 ; 

EDIT # 2

ich programmierte dies in einem Jupyter Notebook, aber das hat einen Fehler von nicht svg Färbung, wenn Sie versuchen, die SVG anzuzeigen mit:

![Decision Tree]('dtree.svg') 

fand ich eine Behelfslösung here:

from IPython.display import HTML 

svg = None 
with open('dtree.svg') as svg_file: 
    svg = svg_file.read() 




Es ist nicht die sexy Lösung, aber ich benutze die Grapviz CLI (es heißt dot) über subprocess, ich bin auf dem Mac, so dass ich es mit Homebrew installiert, aber Sie können Binärdateien für andere Plattformen from their downloads page herunterladen. Hier ein Beispiel mit dem Titanic-Datensatz:

import pandas as pd 
import subprocess 
import seaborn.apionly as sns 
fromwd sklearn.preprocessing import Imputer 
from sklearn.tree import DecisionTreeClassifier, export_graphviz 

raw_data = sns.load_dataset('titanic') 
predictors = ['pclass','sex','age','sibsp','parch','fare','embarked','alone','adult_male'] 
categorical = ['sex','embarked'] 
numeric = [c for c in predictors if c not in categorical] 

encoded_data = pd.get_dummies(raw_data[predictors], columns=categorical) 

imputer = Imputer() 
X = imputer.fit_transform(encoded_data).astype('float32') 
Y = raw_data[target].astype('float32') 

model = DecisionTreeClassifier(min_samples_leaf=10, max_depth=3) 
model.fit(X, Y) 


subprocess.call(['dot', '-Tpdf', 'tree.dot', '-o' 'tree.pdf']) 

~~ Versucht und funktioniert. Das _coloring fehlt jedoch aus dem Diagramm. Gibt es eine einfache Lösung dafür? ~~ Nvm, die Farbgebung kommt von 'pydotplus', was wiederum die Etiketten nicht richtig darstellen kann, also ist es deine Wahl für mich. – Zelphir


Ich bekomme Farben auf meiner, auf welcher Plattform bist du? – maxymoo


Ich bin auf Linux, aber die Sache ist, dass "pydotplus" gibt mir auch eine Warnung, dass es nicht mit 'libexpat' gebaut wurde und ich fand keine Möglichkeit, das zu beheben und es immer noch in einem' virtualenv' zu installieren mit 'pip' oder besser' anaconda'. Ohne libexpat können tabellarische Daten nicht als Label von Knoten angezeigt werden. Wenn ich jedoch das "Punkt" -Tool selbst verwende, wie in der Antwort vorgeschlagen, scheint es keine Farbinformationen in meinen Punktdateien zu geben, so dass es nur logisch erscheint, dass es in keiner Grafik, die aus der Punktdatei erzeugt wird, keine gibt. War ich irgendwo falsch? Colours _would_ be nett immerhin:) – Zelphir