Gibt es eine deutlich schnellere Alternative zu Python 2.7.4 Zipfile-Modul (mit ZIP_DEFLATED) zum Zippen einer großen Anzahl von Dateien in eine einzige Zip-Datei? Ich habe mir die czipfile https://pypi.python.org/pypi/czipfile/1.0.0 angesehen, aber diese scheint sich auf eine schnellere Entschlüsselung (nicht Komprimierung) zu konzentrieren.Schnellere Alternative zu Pythons Zipfile-Modul?
Ich muss routinemäßig eine große Anzahl von Bilddateien (~ 12.000 Dateien einer Kombination von .exr und .tiff-Dateien) mit jeder Datei zwischen ~ 1MB - 6MB Größe (und ~ 9 GB für alle Dateien) verarbeiten) in eine einzige Zip-Datei für den Versand. Dieses Zippen dauert ca. 90 Minuten (läuft unter Windows 7 64bit).
Wenn jemand ein anderes Python-Modul (oder alternativ eine C/C++ - Bibliothek oder sogar ein eigenständiges Tool) empfehlen kann, das eine große Anzahl von Dateien in einer ZIP-Datei in kürzerer Zeit komprimieren kann als das ZIP-Dateimodul , das würde sehr geschätzt werden (alles in der Nähe von ~ 5-10% schneller (oder mehr) wäre sehr hilfreich).
Im schlimmsten Fall können Sie immer die Shell aufrufen und etwas wie 7zip von Python ausführen – Patashu
Verwenden die komprimierten Bilddateien bereits Komprimierungsversionen ihrer jeweiligen Dateiformate? Wenn dies der Fall ist, verschwenden Sie wahrscheinlich erhebliche Verarbeitungszeit, wenn Sie versuchen, sie mit geringem Gewinn erneut zu komprimieren, indem Sie ZIP_DEFLATED anstelle von ZIP_STORED verwenden. Die Dokumentation für Python 2 & 3 besagt auch, dass das Modul ['zipfile'] (http://docs.python.org/2/library/zippfile.html#module-zipfile) nur die Entschlüsselung von verschlüsselten Dateien unterstützt ZIP-Archive, nicht erstellen - also wie genau machst du das? – martineau
@Patashu danke für den Vorschlag, ich werde es versuchen und die Leistung testen. Die Dateien müssen .zip-Dateien sein, sonst würde ich mehr mit anderen Packungsformaten experimentieren. –