Ich baue einen Hadoop (0.20.1) mapreduce Job, der HBase (0.20.1) sowohl als Datenquelle als auch als Datensenke verwendet. Ich würde gerne den Job in Python schreiben, der mich dazu gezwungen hat, hadoop-0.20.1-streaming.jar zu verwenden, um Daten zu und von meinen Python-Skripten zu streamen. Dies funktioniert gut, wenn die Datenquelle/Senke HDFS-Dateien sind.Hadoop mapreduce streaming von HBase
Unterstützt Hadoop Streaming von/nach HBase für mapreduce?
Haben Sie einen Blick nahm zu Hbase + Kafka + Spark-Streaming Integration? – Mike