In einem unserer Projekte verwenden wir Kafka mit AVRO, um Daten über Anwendungen hinweg zu übertragen. Daten werden zu einem AVRO-Objekt hinzugefügt, und das Objekt ist binär codiert, um nach Kafka zu schreiben. Wir verwenden die binäre Kodierung, wie sie im Allgemeinen als eine minimale Darstellung im Vergleich zu anderen Formaten erwähnt wird.Komprimiert binäre Codierung von AVRO Daten?
Die Daten sind in der Regel eine JSON-Zeichenkette, und wenn sie in einer Datei gespeichert werden, werden bis zu 10 MB Disk benötigt. Wenn die Datei jedoch komprimiert ist (.zip), verwendet sie nur wenige KB. Es geht uns darum, solche Daten in Kafka zu speichern, also vor dem Schreiben auf ein Kafka-Thema zu komprimieren.
Wenn die Länge der binärcodierten Nachricht (d. H. Länge des Byte-Arrays) gemessen wird, ist sie proportional zur Länge der Datenfolge. Ich nehme also an, dass die Binärcodierung keine Größe reduziert.
Könnte mir jemand sagen, ob Binärcodierung Daten komprimiert? Wenn nicht, wie kann ich Kompression anwenden?
Danke!