Hier ist mein Datenrahmen Split ein Funke Datenrahmen mit zeilenbegrenzer
Die Basis RDD, dass dieser Datenrahmen arbeitet an mit Index gezippt. Ich möchte diesen ursprünglichen Datenrahmen in mehrere Datenrahmen aufteilen, wobei das Trennzeichen auf der ersten Spaltenfolge basiert (z. B. "GCKN" in diesem Fall).
Ich gehe davon aus, wenn ich die einzelnen Datenrahmen, ich andere Werte als auch wie diese kombinieren ..
A F G
GCKN:GCKN_cppr0/in:GCKN_cppr0/out:GCKN_cppr15/in.. -71 531
Ist dies möglich. Was ist der beste Weg, dies zu tun?
gefolgt gefunden werden Aggregatfunktion hier verwendet entfachen kann? Ich finde immer noch die Semantik heraus. Bitte lassen Sie mich wissen, wenn jemand es versucht hat. – user1384205