Im Entscheidungsbaum J48 Beispiel, wenn wir Baum beschnitten oder ungestraft sagen, was ist der Unterschied?Was ist beschnittener und ungeschnittener Baum in Weka?
Antwort
Die ungeprüften Bäume sind größer. Was passiert, ist, dass der Baum im Grunde nach dem implementierten Algorithmus erstellt wird und, wenn das Beschneiden aktiviert ist, ein zusätzlicher Schritt betrachtet, welche Knoten/Zweige entfernt werden können, ohne die Leistung zu sehr zu beeinflussen.
Die Idee hinter dem Beschneiden ist, dass Sie nicht nur den Baum einfacher zu verstehen machen, sondern auch das Risiko einer Überanpassung an die Trainingsdaten reduzieren. Das heißt, in der Lage zu sein, die Trainingsdaten (fast) perfekt zu klassifizieren, aber nichts anderes, weil der Baum, anstatt das zugrundeliegende Konzept zu lernen, die Eigenschaften gelernt hat, die für die Trainingsdaten spezifisch und spezifisch sind.
Da Weka ein maschinelles Lernen Suite ist, es klingt wie das, was sie sich beziehen, ist dies:
http://en.wikipedia.org/wiki/Pruning_(decision_trees)
Kurz gesagt, die Beschneidung eines Entscheidungsbaums scheint die Beseitigung möglicher Entscheidungen zu sein, nicht viel nutzen.
Allerdings habe ich Weka nicht verwendet und bin damit nicht vertraut. Auf andere Antworten verzichten und sehen, ob das, was sie sagen, zuerst Sinn ergibt.
Ich möchte folgend zu Lars Antwort hinzufügen. Aus folgenden link
Viele Algorithmen versuchen, ihre Ergebnisse zu "beschneiden" oder zu vereinfachen. Beschneiden erzeugt weniger, leichter interpretierbare Ergebnisse. Noch wichtiger ist, dass das Beschneiden als ein Werkzeug verwendet werden kann, um eine mögliche Überanpassung zu korrigieren. ...
J48 verwendet zwei Beschneidungsmethoden.
Die erste ist als Teilbaum Ersatz bekannt. Dies bedeutet, dass Knoten in einem Entscheidungsbaum durch ein Blatt ersetzt werden können - wodurch die Anzahl der Tests entlang eines bestimmten Pfads reduziert wird. Dieser Prozess beginnt bei den Blättern des vollständig geformten Baums und wirkt rückwärts auf die Wurzel.
Die zweite Art des Beschneidens, die in J48 verwendet wird, wird Teilbaumanhebung genannt. In diesem Fall kann ein Knoten nach oben zum Stamm des Baums verschoben werden und andere Knoten auf dem Weg ersetzen. Das Subtree-Raising hat oft einen vernachlässigbaren Effekt auf Entscheidungsbaummodelle. Es gibt oft keine klare Möglichkeit, den Nutzen der Option vorherzusagen, obwohl es ratsam sein könnte, sie auszuschalten, wenn der Induktionsprozess lange dauert. Dies liegt an der Tatsache, dass das Subtree-Erhöhen etwas rechenintensiv sein kann.
Der erste Satz kann falsch sein. Die ungeprüften Bäume sind * größer *, oder? – stackoverflowuser2010
Hoppla, ja, Entschuldigung. Ich werde das ändern. –