Sagen wir, ich habe die folgenden zwei RDDs, mit den folgenden Schlüsselpaaren Werte.Welche Funktion in Spark verwendet wird, um zwei RDDs durch Tasten zu kombinieren
rdd1 = [ (key1, [value1, value2]), (key2, [value3, value4]) ]
und
rdd2 = [ (key1, [value5, value6]), (key2, [value7]) ]
Jetzt will ich sie von Schlüsselwerten verbinden, so zum Beispiel ich folgende
ret = [ (key1, [value1, value2, value5, value6]), (key2, [value3, value4, value7]) ]
zurückkehren wollen, wie ich kann ich dies tun, in Funken mit Python oder Scala? Eine Möglichkeit ist die Verwendung von Join, aber Join würde ein Tupel innerhalb des Tupels erzeugen. Aber ich möchte nur ein Tupel pro Schlüsselwertpaar haben.
Funktioniert nicht. Gewerkschaft ist nicht bekannt. – nottinhill
@SirBenBenji Er meinte wahrscheinlich rdd1.union (rdd2)? – Sai
@Sai Das Gleiche, oder? Nicht sicher ist mit "nicht gefunden" gemeint. – maasg