2016-06-09 13 views

Antwort

1

Die beste Option wäre, eine externe Tabelle in Hive zu erstellen, die aus Ihren Dateien in HDFS stammt. Dann können Sie eine Hive-Tabelle erstellen, um Ihre aggregierten Daten zu speichern, und einige Hive SQL, um die Einfügung in diese Tabelle durchzuführen.

+0

Aber ich habe 70 Dateien in HDFS. Ich denke, ich brauche keine 70 Tabellen in Hive zu erstellen, um die Aggregation durchzuführen. Gibt es eine Möglichkeit, all diese Dateien in die gleiche Tabelle zu importieren? Danke! – SaCvP

+0

Hive übernimmt automatisch die Vereinigung der Tabellen. Solange sie dieselbe Struktur haben, benötigen Sie nur eine externe Tabelle, deren Speicherort der HDFS-Pfad zu Ihren 70 Dateien ist. – Jared