In Abschnitt 3.4 von their article erklären die Autoren, wie sie mit fehlenden Werten umgehen, wenn sie nach dem besten Kandidaten für Baumwachstum suchen. Insbesondere erstellen sie eine Standardrichtung für diese Knoten, wobei als Teilungsfunktion eine mit fehlenden Werten in der aktuellen Instanzgruppe verwendet wird. Zur Vorhersagezeit wird, wenn der Vorhersagepfad diesen Knoten durchläuft und der Feature-Wert fehlt, die Standardrichtung eingehalten.xgboost: Behandlung von fehlenden Werten für die Suche nach Splitkandidaten
Die Vorhersagephase würde jedoch zusammenbrechen, wenn die Feature-Werte fehlen und der Knoten keine Standardrichtung hat (und dies kann in vielen Szenarien vorkommen). Mit anderen Worten, wie ordnen sie allen Knoten eine Standardrichtung zu, selbst solchen mit einer Funktion zum Fehlen von Teilen in der aktiven Instanz, die zur Trainingszeit eingestellt wurde?
Ich weiß, dass es eine Weile her ist, seit du diese Antwort geschrieben hast, aber ich habe mich gefragt, ob du etwas Glück dabei hast, herauszufinden, was xgboost während der Vorhersage macht, wenn im Trainingsdatensatz keine Werte fehlen. – ponadto
Hallo, bitte schauen Sie sich die Antwort unten von T. Scharf an – pmarini