Bitte unter dem psuedocode finden:Wie fügt man die RDD-Daten in einen Datenrahmen in pyspark ein?
Quelle Datenrahmen mit 5 Spalten
einen Zieldatenrahmen mit Schema (6 Spalten) Erstellen
Für Artikel in source_dataframe: #adding eine Spalte auf die Liste kauft Überprüfung item.coulmn2 list = [item.column1, item.column2, newcolumn] #eine rdd aus dieser liste erstellen #now ich muss diese rdd zu einem zieldatenframe hinzufügen ?????
Vielen Dank !!! Mein Szenario ist ein bisschen kompliziert, aber das hat das Problem gelöst. Für jetzt, werde ich die Frage mit mehr Details stellen. –