Redshift ist ein säulenartiger Speicher. Das Speichern von Daten im JSON-Format beschleunigt die Abfrage nicht. Dies würde mit einer NOSQL-Datenbank des Dokumentmodells funktionieren, nicht jedoch mit RedShift. Um RedShift-Abfragen effizient zu gestalten, ist der Verteilungsstil (selbst für das Szenario, in dem Daten keiner bestimmten Reihenfolge folgen oder zufällig sind) der Tabellen wichtig, basierend auf der Anzahl der Cluster, die Sie haben. Außerdem würde Ihnen der Verteilungsschlüssel in der Primärschlüsselspalte (in einem anderen RDBMS-Modell) und der Sortierschlüssel für dieselben in Joins helfen (er würde den Join zum Sortieren von Zusammenführungen anstelle des längeren Hash-Joins verwenden).
Weitere Details hierzu finden Sie in der Dokumentation. RTFM ist dein Freund hier.
können Sie ein Beispiel hinzufügen? Im Allgemeinen führen alle Textmanipulationen dazu, dass die Abfragen länger ausgeführt werden. Die Abfrage kann jedoch hilfreich sein – alexanderlz