In der nächsten Version von NiFi (0.7.0) wird es einige erste Prozessoren für die Interaktion mit Hive geben. Eine davon ist PutHiveQL, die eine Flow-Datei mit einer Hive-QL-Anweisung als Inhalt aufnehmen und mit dem Hive-JDBC-Treiber ausführen kann. Der wahrscheinliche Ablauf für csv oder json besteht darin, zuerst die Daten in die Werte zu analysieren, die zum Konstruieren einer insert-Anweisung wahrscheinlich mit ExtractText oder EvaluateJsonPath erforderlich sind, und dann ReplaceText und Ausdrücke verwenden, um die insert-Anweisung zu erstellen. Der andere übliche Ansatz ohne die Hive-Prozessoren besteht darin, den PutHDFS-Prozessor zum Speichern von Daten in einem Verzeichnis in HDFS zu verwenden und dann eine externe Hive-Tabelle darüber zu erstellen.
hey Bryan, ich habe mir die Release Notes für die Version 0.7.0 angesehen und sehe keine neuen Prozessoren für die Hive. Hier ist der Link Ich verweise auf https://cwiki.apache.org/confluence/display/NIFI/Release+Notes#ReleaseNotes-Version0.7.0 – Nz1