Ich arbeite für einen Client, wo ich einige Dateien in HDFS mit Snappy Kompression legen sollte. Mein Problem ist Snappy Codec ist nicht in mapred-site.xml
oder hdfs-site.xml
Wie man Datei auf HDFS mit Snappy Kompression setzt
definiert Irgendwie muss ich Dateien vorzugsweise mit hdfs put
Befehl setzen und sie sollten komprimiert werden. Es gibt keine Möglichkeit, Konfigurationsdateien zu ändern, da es sich um eine Produktionsmaschine und andere Personen handelt, die sie aktiv verwenden.
Eine weitere vorgeschlagene Lösung bestand darin, Dateien ohne Komprimierung in HDFS zu importieren, dann externe Hive-Tabellen mit Komprimierung zu erstellen und ihre Quelldateien zu verwenden, während die unkomprimierten Dateien gelöscht wurden. Aber das ist ein langer Weg und es ist nicht garantiert, dass es funktioniert.
Alle Vorschläge werden zur Verwendung von hdfs put
mit einer Art von Parametern zum Komprimieren von Dateien geschätzt.
Dies ist nicht möglich, 'Put' bewegt Daten einfach. –