2016-05-05 1 views
0

In Scikit mit zufälligen Wald. Ist es möglich, eine Aufteilung für ein bestimmtes Binär-Feature zu erzwingen? Ich habe einen Datensatz, bei dem eines der Merkmale Mann oder Frau ist. Ich habe herausgefunden, dass sie sich so sehr unterscheiden, dass die erste Trennung vom Sex sein sollte. Ich kann natürlich zu Modellen machen, aber es war praktisch mit einem Modell.Force Split zufällige Wald

Antwort

0

Kurz gesagt, Nr

jedoch Ihre Frage, die Sie nicht vollständig schlägt vor, verstehen, wie ein Zufall Wald funktioniert.

Ich schlage vor, https://citizennet.com/blog/2012/11/10/random-forests-ensembles-and-performance-metrics/

Die Splits Einlesen der Daten werden in einer Art und Weise getan Varianz zu maximieren, zwischen den Splits. Wenn also das von Ihnen genannte Feature wirklich prädiktiv ist, sollten sich die Bäume an diesem Punkt aufteilen (abhängig von der Vorhersagekraft anderer Features).

Zusätzlich haben alle Baummodelle in Sklearn die Möglichkeit, die Splits zu exportieren - so können Sie einen Baum anpassen und überprüfen, was passiert.

http://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html

Kapitel 9 in den Elementen des statistischen Lernens umfasst die Theorie in größerer Tiefe (die zum kostenlosen Download auf der Autoren Webseite verfügbar ist), wenn Sie mehr wissen möchten.