2016-04-27 2 views
0

Ich habe eine Tabelle in hbase (v-1.2.1) und ich möchte einige maschinelle Lerntechniken darauf anwenden. Deshalb möchte ich meine Tabellenform hbase zu Pandas Datenrahmen laden.Hbase1.2.1 zu Pandas Datenframe

hbase(main):006:0> list 
TABLE 
cust_sms                
1 row(s) in 0.0120 seconds 
=> ["cust_sms"] 
hbase(main):007:0> 

Der Tabellenname ist "cust_sms" und die Version von hbase ist 1.2.1. Ich bin nicht in der Lage, happybase zu verwenden, da es nur mit hbase 0.9.x-Versionen funktioniert.

`

Antwort

-1

Ich hatte ein Python-Paket geschrieben zu lesen und Pandas Datenrahmen zu und von hbase zu schreiben. Ich habe dieses Paket schon lange nicht mehr benutzt. Sie können es jedoch versuchen. Der Github Repo ist here. Das PyPi-Paket ist here

import happybase 
import numpy as np 
import pandas as pd 
import pdhbase as pdh 
connection = None 
try: 
    connection = happybase.Connection('127.0.0.1') 
    connection.open() 
    df = pdh.read_hbase(connection, 'sample_table', 'df_key', cf='cf') 
    print df 
finally: 
    if connection: 
     connection.close()