in diesem Blog https://blogs.aws.amazon.com/bigdata/post/Tx2ANLN1PGELDJU/Best-Practices-for-Micro-Batch-Loading-on-Amazon-RedshiftWas ist ein optimaler Lastpfad für Redshift?
Ich verstehe nicht, was der wichtigste Punkt des Stroms Ansatz Last ist. Woher kommt das Sparen? Ich verstehe das Deaktivieren von "Analysieren", "Sortieren", "Vakuumieren", "Festkomprimierung" und all das. Aber warum die separaten Spuren oder leere temporäre Tabellen? Sie können all dies ohne die mehreren Spuren tun. Gibt es eine Bedeutung in der Phrase "eine optimale Last Pfad für COPY zu folgen" Was genau ist optimal? das S3-Präfix oder etwas anderes? Was auch immer ist optimal, Warum wäre es nicht optimal, wenn Sie das Verzeichnis in das endgültige Schema laden? Nehmen wir an, dass das Lesen von s3-Dateien der Flaschenhals ist?
Könnte jemand Einblick geben?
Große Antworten. Diese Punkte wurden im referenzierten Blog verloren. – bhomass