2016-07-08 7 views

Antwort

1

IIUC können Sie versuchen:

import feather 
import pandas as pd 

#df is spark df 
pdf = df.toPandas() 
feather.write_dataframe(pdf, 'test.feather') 
+0

Ja, aber im Idealfall möchte ich nicht den gesamten Datenrahmen in den Speicher laden. Szenario: Verarbeiten Sie mit Spark einen Datenrahmen (Merkmalsextraktion) aus dem Speicher und speichern Sie ihn in einer Federdatei. Laden Sie dann die Datei in Python \ R hoch (wahrscheinlich auf einem anderen Computer mit größerer Speicherkapazität). –

+0

Sorry, ich bin kein Experte für Funken. Vielleicht wird eine andere Lösung hilfreicher sein. – jezrael

+0

Kein Problem. Deine Antwort ist nur Lösung, die wir bisher haben :) –