Ich habe eine verwaltete Hive-Tabelle erstellt, die als ORC gespeichert ist und beim Laden von .txt-Dateien funktioniert es gut, jedoch kann ich keine ORC-Datei in diese Tabelle laden. Gibt es etwas mit Trennzeichen zu tun? oder fehle ich etwas?Wie wird eine extern erstellte ORC-Datei in die als ORC gespeicherte HIVE-Tabelle geladen?
1
A
Antwort
1
Unten Code funktioniert für mich, während Laden von ORC-Dateien in HDFS in einer Hive-Tabelle.
Erstellen Sie eine Tabelle im Bienenstock.
create table MyDB.TEST ( Col1 String, Col2 String, Col3 String, Col4 String) STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat';
Daten in die Tabelle laden.
LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST;
Ihre Antwort ist nicht wirklich klar, ORC und Text ist definitiv nicht das gleiche Format. –
Hallo, meine Frage war, ich habe eine ORC-verwaltete Tabelle im Bienenstock und bin nicht in der Lage, ORC-Dateien zu laden, die extern entsprechend dem Tabellenschema erstellt wurden. –
Hat die externe ORC-Datei das gleiche Schema wie Ihre Hive-Tabelle? –