Ich weiß kaum etwas über Kompression, also ertragen Sie mit mir (das ist wahrscheinlich eine dumme und schmerzhaft offensichtliche Frage).Der beste Komprimierungsalgorithmus für XML?
Also sagen wir, ich habe eine XML-Datei mit ein paar Tags.
Jetzt sagen wir, ich habe eine Reihe dieser sehr langen Tags mit vielen Attributen in meinen mehreren XML-Dateien. Ich muss sie auf die kleinste mögliche Größe komprimieren. Der beste Weg wäre, einen XML-spezifischen Algorithmus zu verwenden, der einzelnen Tags Pseudonyme wie vlt1 oder vlt2 zuweist. Dies wäre jedoch nicht so "offen", wie ich es versuche, und ich möchte einen gemeinsamen Algorithmus wie DEFLATE oder LZ verwenden. Es hilft auch, wenn das Archiv eine ZIP-Datei war.
Da es sich um Klartext handelt (keine binären Dateien wie Bilder), möchte ich einen Algorithmus, der zu reinem Text passt. Welcher erzeugt die kleinste Dateigröße (verlustfreie Algorithmen werden bevorzugt)?
Übrigens ist das Szenario: Ich erstelle einen Standard für Dokumente, wie ODF oder MS Office XML, die XML-Dateien enthalten, verpackt in einer .zip.
EDIT: Die 'Verschlüsselung' Sache war ein Tippfehler; Es sollte "Kompression" haben.
Wie hängt das mit der Verschlüsselung zusammen? Und die einfache Antwort ist, dass ZIP die Komprimierung durchführt: es ist weit verbreitet, hat einen guten Job für Text und es ist nicht die Zeit wert, "die kleinste mögliche Größe" zu finden. – kdgregory
Warum nicht einfach OpenXML verwenden? Es ist im Grunde, was du willst :). Nicht sicher, ob es die beste Komprimierung ist, aber ich mag es bisher. Und wenn Sie es nicht bereits wissen, ist OpenXML im Grunde eine Zip-Datei, so dass Sie Ihre Office 2007-Dokumente als ZIP-Datei (z. B. something.docx in something.zip) umbenennen und als Zip-Datei öffnen können. Inside ist im Grunde eine Menge XMLs. –
Sie könnten einfach eine Reihe von XML-Dateien in einer Zip-Datei und jeder gewünschten Dateierweiterung verwenden.Warum die sehr langen Nummern ??? –