Ich habe einen Datensatz mit einer Zielvariablen, die 7 verschiedene Beschriftungen haben kann. Jedes Sample in meinem Trainingssatz hat nur eine Bezeichnung für die Zielvariable.Sklearn - Wie die Wahrscheinlichkeit für alle Zielmarken vorhergesagt wird
Für jede Probe möchte ich die Wahrscheinlichkeit für jede der Zielbeschriftungen berechnen. Also würde meine Vorhersage aus 7 Wahrscheinlichkeiten für jede Reihe bestehen.
Auf der Sklearn-Website habe ich über Multi-Label-Klassifizierung gelesen, aber das scheint nicht, was ich will.
Ich habe den folgenden Code versucht, aber das gibt mir nur eine Klassifizierung pro Probe.
from sklearn.multiclass import OneVsRestClassifier
clf = OneVsRestClassifier(DecisionTreeClassifier())
clf.fit(X_train, y_train)
pred = clf.predict(X_test)
Hat jemand dazu einen Rat? Vielen Dank!
In der kürzlich veröffentlichten Version 0.0.4 von scikit-multilearn finden Sie predict_proba-Implementierungen für problemtransformationsbasierte Multi-Label-Klassifikatormethoden. Im obigen Fall ersetzen Sie die letzte Zeile durch: predictions = classifier.predict_proba (X_test) – niedakh