2016-07-25 26 views
0

Ich versuche R über AWS zu verwenden, um eine Verbindung zu unserem Cluster mit Cloudera-Hadoop herzustellen. Befolgen Sie die hier genannten Schritte - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/Cloudera RImpala-Verbindung funktioniert nicht

Bisher konnte ich den JDBC-Treiber initiieren, aber nicht mit Impala verbinden.

enter image description here.

Aus einigen Untersuchungen kann ich sehen, dass der Impaladämon in allen Arbeiterknoten läuft. Und die Ports sind so konfiguriert.

enter image description here

Auch angemeldet ich an einen der Arbeiter Knoten in und überprüft die Ports, die zu hören sind. Ich kann Port 21050 Hören sehen, hier ist es,

enter image description here

Hier in rimpala verbinden, ich bin mit öffentlicher IP des Arbeitnehmer Knoten. Immer noch nicht in der Lage, sich damit zu verbinden. Ich kann die öffentliche IP-Adresse und den Port 25000 verwenden, um die Impala-Webbenutzeroberfläche anzuzeigen, kann jedoch keine Verbindung zu diesem Port herstellen, der jdbc-Anforderungen überwacht. Kann mir jemand dabei helfen?

Antwort

0

Falls jemand Hilfe sucht, hier ist die Antwort, die ich von Cloudera erhalten habe.

„Das Problem ist nicht mit dem Impala oder Cloudera Distribution. Das Problem ist mit dem Fahrer durch verwendet‚Rimpala‘. RImapla HIVE JDBC Treiber verwendet. Wenn Sie den Quellcode überprüfen bei https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java Sie werden sehen, dass die Anrufe, die als das Laufwerk verwendet werden, "org.apache.hive.jdbc.HiveDriver" ist. Im Idealfall ist RImpala Paket veraltet und es wird nicht aktualisiert, um zu funktionieren. "