Ich frage mich, ob wir einen "optionalen" Schritt in sklearn.pipeline
einrichten können. Zum Beispiel könnte ich für ein Klassifizierungsproblem versuchen, eine ExtraTreesClassifier
mit UND ohne eine PCA
Transformation davor zu versuchen. In der Praxis könnte es eine Pipeline mit einem zusätzlichen Parameter sein, der den Toggle des Schritts PCA
angibt, so dass ich ihn über GridSearch
und so weiter optimieren kann. Ich sehe keine solche Implementierung in der Quelle von slearn, aber gibt es irgendwelche um?Ist es möglich, einen bestimmten Schritt in der Sklearn-Pipeline umzuschalten?
Da ferner die möglichen Parameterwerte einer folgenden Stufe in der Pipeline zu den Parametern in einem vorhergehenden Schritt abhängen könnte (zB gültige Werte von ExtraTreesClassifier.max_features
hängen von PCA.n_components
) ist es möglich, eine derartige bedingte Abhängigkeit in sklearn.pipeline
zu spezifizieren und sklearn.grid_search
?
Vielen Dank!
Wie Eine Randbemerkung, beachten Sie, dass 'ExtraTreesClassifier.max_features' kann ein Float-Wert zwischen 0.0 und 1.0 anstelle einer Ganzzahl sein. Dies ist nützlich, wenn die tatsächliche Anzahl von Features wie in Ihrem Fall variabel ist. –
Vielen Dank für die aufschlussreichen Antworten. Ich denke, sie sind genau das, wonach ich gesucht habe. – dolaameng