Gibt es eine Möglichkeit, Datensätze von zwei verschiedenen s in Funken zu verketten?Verketten von Datensätzen verschiedener RDDs in Apache Spark mit Hilfe von Scala
Anforderung ist - ich erstelle zwei Zwischen-RDDs mit Scala, die gleiche Spaltennamen hat, müssen diese Ergebnisse der RDDs kombinieren und das Ergebnis für den Zugriff auf UI Cache. Wie kombiniere ich die Datensätze hier?
RDDs sind vom Typ spark.sql.SchemaRDD
Kannst du '++' nicht einfach verwenden? – lmm
@lmm Nein. Es fügt Spalten zur RDD hinzu. Ich muss der RDD Zeilen hinzufügen. Ich habe zwei RDDs mit denselben Spalten, deren Datensätze zu einer einzigen RDD zusammengeführt werden müssen. – Atom
Nein, es wird nicht, ich habe es nur versucht, um sicher zu sein. '++' erstellt eine union RDD mit den Ergebnissen von beiden. – lmm