Ich habe eine Variable vom Typ Seq[Seq[(Double, Double)]]
:Wie wird die Funktion verwendet, die RDD [(Double, Double)] als Eingabe für einen Fall von Seq [Seq [(Double, Double)]] erwartet?
val output: Seq[Seq[(Double, Double)]] = runStreams(ssc, numBatches, numBatches)
Jetzt möchte ich die Funktion RegressionMetrics
die RDD[(Double, Double)]
anzuwenden als Eingabe verwendet:
val metrics = new RegressionMetrics(output)
Wie Seq[Seq[(Double, Double)]]
zu RDD zu transformieren [(Double, Double)] `, um Funktionen der Klasse RegressionMetrics nutzen zu können?
Ok, danke. Ich benutze Seq zu Testzwecken. Also, verstehe ich richtig, dass im Falle der Verwendung einiger Daten auf der Festplatte kann ich es in RDD lesen und Seq ersetzen? – Klue
Richtig! Zum Testen: Zunächst können Sie den lokalen Modus von Spark verwenden, um einfach einen unabhängigen SparkContext zu erstellen. Zweitens können Sie entweder 'parallelize' verwenden, wie hier vorgeschlagen, oder die Daten aus der Datei direkt über' SparkContext.textFile' laden –