Ich bin mir bewusst, dass Oracle ZIP/GZIP-Datei Kompressor/Dekompressor-Methoden on their website notiert. Aber ich habe ein Szenario, in dem ich scannen und herausfinden muss, ob verschachtelte ZIPs/RARs beteiligt sind. Zum Beispiel kann der folgende Fall:Java-Dienstprogramm-Bibliothek für verschachtelte ZIP-Datei Handhabung
-MyFiles.zip
-MyNestedFiles.zip
-MyMoreNestedFiles.zip
-MoreProbably.zip
-Other_non_zips
-Other_non_zips
-Other_non_zips
Ich weiß, dass Apache Commons komprimieren Paket und java.util.zip sind die wideley verwendeten Pakete wo commons tatsächlich komprimieren, um die fehlenden Features in java.util.zip zum Beispiel bietet einige Zeicheneinstellungen während des Zipouts. Aber was ich nicht sicher bin, ist die Dienstprogramme für die Wiederholung durch verschachtelte Zip-Dateien und die Antworten auf SO sind nicht sehr gute Beispiele dafür. Ich habe versucht, den folgenden Code (was ich von Oracle Blog bekam), aber wie ich vermuten, die verschachtelte Verzeichnisrekursion schlägt fehl, weil es einfach die Dateien nicht finden kann:
public static void processZipFiles(String pathName) throws Exception{
ZipInputStream zis = null;
InputStream is = null;
try {
ZipFile zipFile = new ZipFile(new File(pathName));
String nestPathPrefix = zipFile.getName().substring(0, zipFile.getName().length() -4);
for(Enumeration e = zipFile.entries(); e.hasMoreElements();){
ZipEntry ze = (ZipEntry)e.nextElement();
if(ze.getName().contains(".zip")){
is = zipFile.getInputStream(ze);
zis = new ZipInputStream(is);
ZipEntry zentry = zis.getNextEntry();
while (zentry!=null){
System.out.println(zentry.getName());
zentry = zis.getNextEntry();
ZipFile nestFile = new ZipFile(nestPathPrefix+"\\"+zentry.getName());
if (zentry.getName().contains(".zip")) {
processZipFiles(nestPathPrefix+"\\"+zentry.getName());
}
}
is.close();
}
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally{
if(is != null)
is.close();
if(zis!=null)
zis.close();
}
}
Kann sein, ich etwas falsch mache - oder mit der falsche utils. Mein Ziel ist es, festzustellen, ob eine der Dateien oder verschachtelten Zip-Dateien Dateierweiterungen haben, die ich nicht erlaube. Dadurch kann ich verhindern, dass meine Benutzer verbotene Dateien hochladen, selbst wenn sie es zippen. Ich habe auch die Möglichkeit, Tika zu verwenden, die rekursives Parsing durchführen kann (mit der Lösung von Zukka Zitting), aber ich bin mir nicht sicher, ob ich die Metadaten verwenden kann, um diese Erkennung zu machen, wie ich will.
Jede Hilfe/Vorschlag wird geschätzt.
umgehen können, sollten Sie nicht Öffnen Sie die verschachtelte Zip-Datei aus dem Eingabe-Stream des äußeren Zip-Eintrags und nicht nach dem Dateinamen (was nicht funktionieren wird, da sich die Datei in der Zip-Datei und nicht im Dateisystem befindet)? – Gagravarr