Meine S3-Datei (s3://MY_s3/stage/my_s3_file
) eine Partition auf load_dt
:Laden Redshift von S3 (mit Partitionen)
S3 Struktur:
-MY_S3
--stage
---my_s3_file
----load_dt=2016-02-01
----000024
----load_dt=2016-02-02
----000036
Die eigentlichen Dateien sind unter load_dt Partitionen wie 000.024 & 000036.
Der COPY-Befehl funktioniert gut, wenn ich load_dt nicht in der Redshift-Tabelle halte, aber wenn ich load_dt in der Redshift-Tabelle hinzufüge, schlägt der COPY-Befehl aufgrund eines Datenfehlers als Eingabe-LayoutfehlZiellayout stimmt nicht überein (mit extra load_dt im Ziel).
Die Hive-Tabelle, die die S3-Datei erstellt, zeigt partitionierte load_dt am Ende.
Wie funktioniert dieser COPY-Befehl, wenn load_dt auf dem Ziel-Redshift ist?
Ich habe sogar versucht, S3-Standorte zu s3://MY_s3/stage/my_s3_file/load_dt
zu ändern, aber kein Glück.
ich in der Lage bin Tisch zu laden, ohne load_dt mit S3 Lage s3: // MY_s3/stage/my_s3_file/aber nicht in der Lage, die letzte Spalte hinzuzufügen, die die Partitionsspalte load_dt ist. Mit s3: // MY_s3/stage/my_s3_file/load_dt = 2016-02-01 werden nur diese Partitionsdaten geladen, jedoch ohne den Wert load_dt. – rkj