2016-04-27 274 views
0

我在hbase(v-1.2.1)中有一個表格,我想在其上應用一些機器學習技術。因此我想將我的表格hbase加載到熊貓數據框。Hbase1.2.1 to pandas dataframe

hbase(main):006:0> list 
TABLE 
cust_sms                
1 row(s) in 0.0120 seconds 
=> ["cust_sms"] 
hbase(main):007:0> 

表名是「cust_sms」,而hbase的版本是1.2.1。我無法使用happybase,因爲它僅適用於hbase 0.9.x版本。

`

回答

-1

我寫了一個Python包讀寫大熊貓dataframes,並從HBase的。我在相當長的一段時間內沒有使用過這個軟件包。你可以嘗試一下。 github回購是here。 PyPi包是here

import happybase 
import numpy as np 
import pandas as pd 
import pdhbase as pdh 
connection = None 
try: 
    connection = happybase.Connection('127.0.0.1') 
    connection.open() 
    df = pdh.read_hbase(connection, 'sample_table', 'df_key', cf='cf') 
    print df 
finally: 
    if connection: 
     connection.close()