Ich versuche zu lernen, Hive und während der Verweis auf die Hadoop Definitive Guide, hatte ich einige Verwirrungen.Verständnis Partitionierung in Hive
Wie im Text beschrieben, wird die Partition in Hive durch Erstellen von Unterverzeichnissen mit denselben Werten der Partitionierungsspalte erstellt. Aber beim Hive-Datenladen bedeutet das einfach das Kopieren von Dateien, und während des Ladens werden keine Datenvalidierungsprüfungen durchgeführt, aber während des Abfragens überprüft Hive die Daten auf Partitionierung. Oder wie bestimmt es, welche Datei in welches Verzeichnis gehen soll?