2016-07-11 25 views
0

Die Dokumentation von DASK besagt: "BColz ist ein auf Festplatte, Chunked, komprimiert, column-store. Diese Attribute machen es sehr attraktiv für dask.dataframe, die besonders gut darauf funktionieren kann eine spezielle from_bcolz-Funktion. "Speichern von dask dataframe im bcolz-Format

Allerdings konnte ich kein Beispiel finden, wie zu ein dask Datenrahmen zu bcolz speichern. Was ist der empfohlene Weg, dies zu tun?

+0

eine mögliche Lösung könnte sein, den dask dataframe wie hier beschrieben in ein dask-array umzuwandeln (http://stackoverflow.com/q/37444943/5082048) und als bcolz wie hier beschrieben zu speichern (http: // dask .pydata.org/de/aktuell/array-creation.html # store-dask-arrays) –

Antwort

1

Ich habe eine Pull-Anfrage erstellt, um dies zu implementieren. Bis es in den Master-Zweig verschmolzen ist, können Sie es hier finden:

https://github.com/dask/dask/pull/1386

Wenn Sie wollen nicht Ihre eigene Dask Implementierung bearbeiten können Sie einfach die to_bcolz Methode kopieren.