Ich bin neu in Apache Pig und ich möchte einige Verarbeitungsdetails darüber, wie es Datensätze in FS speichert. 1.Für jede Tuple, wo macht PigStorage sie in lesbare String? 2. Kann ich diese stringfy
Ich habe 100 pdf's, aber jedes pdf hat 40 Seiten, d. H .. es ist nicht verarbeitet. Eigentlich versuchen wir, Schwein UDF zu benutzen ?? Können wir PDF-Dateien mit Pig UDF teilen?
Kann mir jemand sagen, wie Pig UDF-Objekte instanziiert? Ich habe Pig benutzt, um eine Pipeline aufzubauen, um einige Daten zu verarbeiten. Ich habe die Pipeline im Multi-Node-Cluster Hadoop implement
Ich versuche, eine Datei zu verarbeiten. ab sofort bekomme ich die Ausgabe wie unten gezeigt. input file:-
c=1,2,3
a,b,c,d,a
d,e,f
g,h,i,i
c=2,3,4
j,k,l
m,n,a,h
c=3,2,5
d,g,a
s,fs,a
e