Ich möchte Namen von zwei Spalten ändern mit Funken mit ColumnRenamed Funktion. Natürlich kann ich schreiben:PySpark - benenne mehr als eine Spalte mit withColumnRenamed
data = sqlContext.createDataFrame([(1,2), (3,4)], ['x1', 'x2'])
data = (data
.withColumnRenamed('x1','x3')
.withColumnRenamed('x2', 'x4'))
aber ich möchte diesen Schritt in einem tun (Liste/Tupel neuer Namen haben). Leider weder diese:
data = data.withColumnRenamed(['x1', 'x2'], ['x3', 'x4'])
noch dies:
data = data.withColumnRenamed(('x1', 'x2'), ('x3', 'x4'))
arbeitet. Ist es möglich, dies so zu machen?
Ich bekomme "str ist nicht aufrufbar Fehler": data.select ([col (c). Alias (Zuordnung.get (c, c)) für c in data.columns]) TypeError: 'str' Objekt ist nicht aufrufbar –