2016-07-08 9 views

Antwort

0

In der nächsten Version von NiFi (0.7.0) wird es einige erste Prozessoren für die Interaktion mit Hive geben. Eine davon ist PutHiveQL, die eine Flow-Datei mit einer Hive-QL-Anweisung als Inhalt aufnehmen und mit dem Hive-JDBC-Treiber ausführen kann. Der wahrscheinliche Ablauf für csv oder json besteht darin, zuerst die Daten in die Werte zu analysieren, die zum Konstruieren einer insert-Anweisung wahrscheinlich mit ExtractText oder EvaluateJsonPath erforderlich sind, und dann ReplaceText und Ausdrücke verwenden, um die insert-Anweisung zu erstellen. Der andere übliche Ansatz ohne die Hive-Prozessoren besteht darin, den PutHDFS-Prozessor zum Speichern von Daten in einem Verzeichnis in HDFS zu verwenden und dann eine externe Hive-Tabelle darüber zu erstellen.

+0

hey Bryan, ich habe mir die Release Notes für die Version 0.7.0 angesehen und sehe keine neuen Prozessoren für die Hive. Hier ist der Link Ich verweise auf https://cwiki.apache.org/confluence/display/NIFI/Release+Notes#ReleaseNotes-Version0.7.0 – Nz1