2016-08-08 45 views
0

Ich habe Probleme mit dem einfachen Laden von Daten zu testen und zu analysieren. Ich verwendeLaden von Json mit elefantbird - Fehler mit einfacher Aufgabe

https://www.reddit.com/r/datasets/comments/3oiv9z/reddit_september_comment_archive_is_now_available/

nach dem Aufstehen nur 10000 Zeilen aus dieser Datei ich versuche, sie zu Schwein zu laden.

Sogar so etwas wie diese Rückkehr Fehler.

REGISTER '/user/cloudera/json-simple-1.1.1.jar' 
REGISTER '/user/cloudera/elephant-bird-pig-4.1.jar' 
REGISTER '/user/cloudera/elephant-bird-hadoop-compat-4.1.jar' 

a = LOAD '/user/cloudera/top' USING com.twitter.elephantbird.pig.load.JsonLoader() as (json:map[]); 

Fehlercode:

Hauptklasse [org.apache.oozie.action.hadoop.PigMain], Exit-Code [2]

+0

Können Sie Ihr Fehlerprotokoll hier posten? – Bector

Antwort

0

Versuchen Sie, diese

läuft
REGISTER 'elephant-bird-pig-4.1.jar'; 
REGISTER 'elephant-bird-hadoop-compat-4.1.jar'; 

input = LOAD '/input/file' USING com.twitter.elephantbird.pig.load.JsonLoader('-nestedLoad') AS input_map;