2015-10-15 164 views
2

我試圖在下列情況下工作:如何在HBase中存儲XML文件?

  1. 我有簡單的XML數據:

    <main_tag> 
        <x> 
         <a>name value</a> 
         <b>age value</b> 
        </x> 
        <y> 
         <c>country value</c> 
        <y> 
    </main_tag> 
    

    我想上面的XML文件存儲在HBase的。我們該怎麼做?

  2. 如果我有大量的XML文件,我該如何將文件批量加載到HBase中?

在這兩種情況下,我最初都不想使用HDFS。

+2

http://stackoverflow.com/questions/8173983/best-way-to-store-hierarchical-data-in-hbase –

回答

0

你的第一個問題由@ravindra回答。對於第二個問題,您可以選擇批量加載,您可以使用map reduce讀取大量數據,並將其轉換爲HFile格式,然後使用批量加載命令將map reduce的輸出加載到Hbase。爲此,由於map reduce會從HDFS讀取數據,因此HDFS中應該有大量數據。

這也取決於你的數據。請查看here瞭解更多信息。

+0

所以,我們必須使用HDFS批量加載xml數據嗎?你能否提供一個示例代碼,將大量的xml數據加載到hbase中 –