Ich habe eine Reihe von Daten, auf denen ich den Multispeicherbefehl auf Spalte 'Typ' lief und jetzt habe ich diese Pfade in hdfs: "/output/type1/ " "/output/Typ2/", "/output/Typ3/" usw.Molchausgabe von Multistorage angehängt werden, wenn ich es jeden Tag ausführen
Nun Everyday i ein Skript mit multistorage Befehl auf Spalte 'Typ' laufen, um" /tmp/type1/ "," /tmp/type2/ "," /tmp/type3/ "usw. (Typen können hier entweder < oder = die Typen in der Masterausgabe sein, die bereits vorhanden sind).
Da Pig es mir nicht erlaubt, den Ausgabepfad eines bereits vorhandenen Verzeichnisses anzugeben, ist mein Skript, das jeden Tag ausgeführt wird,/tmp /. Gibt es eine Möglichkeit,/tmp/with/output/unter den richtigen 'type'-Unterverzeichnissen zu kombinieren?
Erwartet werden/tmp/type1/file unter/output/type1/as/output/type1/file und so weiter. So kann ich das/tmp löschen und das Skript erneut ausführen.
Jede Hilfe wird geschätzt. Vielen Dank im Voraus.
Wie Sie wissen, welche Art Verzeichnis willst du speichern? – 54l3d
Typ Verzeichnisse werden dynamisch erstellt, indem Multistorage-Befehl auf 'Typ' Spalte verwendet – dreddy