Können Sie ein Beispiel geben, was Sie zu tun versuchen? Wenn ich etwas in einem IPython-Notebook starte, das teuer ist, schreibe ich es fast immer auf Disk-Nachwort. Zum Beispiel, wenn meine Daten eine Liste von JSON-Objekt ist, schreibe ich es auf der Festplatte als Linie JSON formatierte Strings getrennt:
with open('path_to_file.json', 'a') as file:
for item in data:
line = json.dumps(item)
file.write(line + '\n')
Sie können dann zurück in den Daten auf die gleiche Weise lesen:
data = []
with open('path_to_file.json', 'a') as file:
for line in file:
data_item = json.loads(line)
data.append(data_item)
Ich denke, das ist im Allgemeinen eine gute Übung, weil es Ihnen ein Backup gibt. Sie können auch Gurke für das gleiche verwenden. Wenn Ihre Daten wirklich groß sind, können Sie tatsächlich gzip.open
direkt in eine Zip-Datei schreiben.
EDIT
Um ein scikit lernen Modell auf der Festplatte Verwendung joblib.pickle
zu speichern.
from sklearn.cluster import KMeans
km = KMeans(n_clusters=num_clusters)
km.fit(some_data)
from sklearn.externals import joblib
# dump to pickle
joblib.dump(km, 'model.pkl')
# and reload from pickle
km = joblib.load('model.pkl')
Ich weiß nicht, ob es solche Fähigkeiten in Ipython gibt, aber Sie könnten Ihre teuren Berechnungen einfach mit z. B. [joblib.Memory] (https://pythonhosted.org/joblib/memory.html) auf die Festplatte zwischenspeichern). – rth