Ich habe auf Google nach diesem Problem gesucht und ich kann nichts finden, das diesen Algorithmus in einer einfachen, aber detaillierten Weise erklärt.Warum verwendet der C4.5-Algorithmus das Beschneiden, um den Entscheidungsbaum zu reduzieren, und wie wirkt sich das Beschneiden auf die Vorhersagegenauigkeit aus?
Zum Beispiel weiß ich, dass der ID3-Algorithmus überhaupt keine Beschneidung verwendet. Wenn Sie also ein kontinuierliches Merkmal haben, wird die Vorhersageerfolgsrate sehr niedrig sein.
Also der C4.5 um kontinuierliche Eigenschaften zu unterstützen verwendet es Beschneidung, aber ist dies der einzige Grund?
Auch kann ich in der WEKA-Applikation nicht wirklich verstehen, wie genau der Vertrauensfaktor die Effizienz der Vorhersagen beeinflusst. Je kleiner der Vertrauensfaktor ist, desto mehr wird der Algorithmus beschneiden. Wie groß ist der Zusammenhang zwischen der Beschneidung und der Genauigkeit der Vorhersage? Je mehr Sie beschneiden, desto besser die Vorhersagen oder schlechter?
Dank