Momentan fallen wir die Tabelle täglich und führen das Skript, das die Daten in die Tabellen lädt. Script dauert 3-4 Stunden, während denen keine Daten verfügbar sind. Unser Ziel ist es nun, die alten Hive-Daten den Analysten zur Verfügung zu stellen, bis die Ausführung der neuen Daten geladen ist.Drop-Hive-Tabelle Partition durch Schwein Skript
Ich erreiche diese Sache im hql-Skript, indem ich tägliche Daten in die auf load_year, load_month und load_day partitionierten Hive-Tabellen lade und die gestrigen Daten durch Löschen der Partition lösche. Aber was ist die Option für Schwein Skript, um das gleiche zu erreichen? Können wir den Tisch durch Schweineschrift verändern? Ich möchte die andere hql nicht ausführen, um eine Partition nach dem anderen zu löschen. Danke
Schwein wird für den Datenfluss verwendet ... also, während für die Prozess pic richtigen Daten sammeln Daten ... –
Es tut mir leid. Ich habe dich nicht verstanden. Meine Frage bezieht sich nicht auf das Abholen von Daten, sondern bezieht sich auf das Speichern der Daten im Schwein und nach dem Speichern des Ablegens der alten Daten durch das Schwein. – Renu