Ich habe einen einfachen Schwein Job, der eine Spalte von Daten generiert. Um Leerzeilen aus der Ausgabe zu beseitigen, schrieb ich den folgenden Befehl ein:PIG erzeugt leere Zeilen
items = FOREACH inputs GENERATE item;
items = DISTINCT items;
items = FILTER items BY ($0 IS NOT NULL);
items = FILTER items BY NOT IsEmpty(TOBAG($0));
STORE items INTO '$output/items';
Während ich versuche, NULL und leere Einträge zu beseitigen, habe ich noch leere Zeilen in den Ausgabedateien auf HDFS bekommen.
Es ist erwähnenswert, wenn ich die letzte Zeile (d.h. STORE) mit Ersetzen
DUMP items;
Das Terminal Ausgang zeigt nicht die Leerausgangsleitung.
Alle Kommentare zur Ursache dieses Problems werden sehr geschätzt.