Ich versuche, die Klassenwahrscheinlichkeiten eines zufälligen Waldobjekts zu extrahieren, das ich mit PySpark trainiert habe. Ich sehe jedoch nirgendwo in der Dokumentation ein Beispiel dafür, und es ist auch keine Methode von RandomForestModel
.PySpark & MLLib: Klassenwahrscheinlichkeiten von zufälligen Waldvorhersagen
Wie kann ich Klassenwahrscheinlichkeiten aus einem RandomForestModel
Klassifikator in PySpark extrahieren?
Hier ist der Beispielcode in der Dokumentation, die nur die letzte Klasse bietet (nicht die Wahrscheinlichkeit):
from pyspark.mllib.tree import RandomForest
from pyspark.mllib.util import MLUtils
# Load and parse the data file into an RDD of LabeledPoint.
data = MLUtils.loadLibSVMFile(sc, 'data/mllib/sample_libsvm_data.txt')
# Split the data into training and test sets (30% held out for testing)
(trainingData, testData) = data.randomSplit([0.7, 0.3])
# Train a RandomForest model.
# Empty categoricalFeaturesInfo indicates all features are continuous.
# Note: Use larger numTrees in practice.
# Setting featureSubsetStrategy="auto" lets the algorithm choose.
model = RandomForest.trainClassifier(trainingData, numClasses=2, categoricalFeaturesInfo={},
numTrees=3, featureSubsetStrategy="auto",
impurity='gini', maxDepth=4, maxBins=32)
# Evaluate model on test instances and compute test error
predictions = model.predict(testData.map(lambda x: x.features))
ich jede model.predict_proba()
Methode nicht sehen - was soll ich tun ??
spät, aber es gibt eine Gabel mit einer scala Lösung: https: //github.com/apache/spark/compare/master...mqk:master –
die Frage jetzt war (meist) in der neuen Spark-ML-Bibliothek aufgelöst: https://stackoverflow.com/questions/43631031/pyspark- how-to-get-Klassifizierung-Wahrscheinlichkeiten-from-Multilayerperceptronclassi/43643426 # 43643426 – desertnaut