任何人都直接在Hbase表上使用SparkSQL,比如Hive表上的SparkSQL。 我是新來的spark.Please指導我如何連接hbase和spark.How查詢hbase表。HBase表上的SparkSQL
回答
AFAIK有2種方式連接到HBase的表
- 直接連接到HBase的:
直接連接HBase的,並創建一個RDD
和DataFrame
最重要的是執行SQL。 我不打算重新發明輪子,請參閱How to read from hbase using spark 作爲@iMKanchwala在上述鏈接中的回答已經描述了它。唯一的東西是將其轉換爲數據框(使用toDF
)並遵循sql方法。
- 將表註冊爲具有hbase存儲處理程序的hive外部表,並且您可以在hivecontext的spark上使用hive。這也是簡單的方法。
Ex :
CREATE TABLE users(
userid int, name string, email string, notes string)
STORED BY
'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
"hbase.columns.mapping" =
」small:name,small:email,large:notes」);
如何做到這一點,請參閱作爲example
我寧願方法1.
希望幫助...
感謝您的答案。它對我更有幫助。我試過第二種方法意味着HBaseStorageHandler表,我無法使用HiveContext進行連接。可以請告訴我如何爲這種類型的表創建上下文對象。它會拋出ClassNotFoundException。是否需要任何配置? – user6608138
我希望你沒有用過**。如果你使用,然後刪除.all *字符。我也編輯了我的答案。 REG。 hivecontext val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc)就是這樣。 –
CREATE TABLE test.sample(id string,name string) 存放於'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITH SERDEPROPERTIES(「hbase.columns.mapping」=「:key,details:name」) TBLPROPERTIES(「hbase.table.name」=「sample」);啓動Spark shell: spark-shell --master local [2] – user6608138
- 1. 從sparksql插入多個comulns到hbase
- 2. 使用SparkSQL查詢Hive/HBase表的Java/Scala代碼示例?
- 3. sparksql drop hive表
- 4. SparkSQL四倍表
- 5. SparkSQL:幀內SparkSQL應用表登記
- 6. sparkSql .registerTempTable:ERROR表未找到
- 7. 使用SparkSQL閱讀Impala表
- 8. SparkSQL中的Concat
- 9. HBase上的Apache Gora
- 10. 大小HBase的表
- 11. sparkSQL的SBT依賴
- 12. Hbase .META表
- 13. HBase表設計
- 14. Hive在HBase現有表上查詢
- 15. Pyspark sparkSql問題
- 16. 相當於SparkSQL
- 17. 懶評價SparkSQL
- 18. hbase上的泰坦熱區
- 19. Hbase上的YCSB錯誤
- 20. HBase的表存在預期
- 21. HBase的表檢索數據
- 22. 每個HBase表的Reducer
- 23. 保存JSON從SparkSQL
- 24. SparkSQL PostgresQL Dataframe分區
- 25. sparksql:禁用INFO StatsReportListener
- 26. Spark新手(ODBC/SparkSQL)
- 27. Hive/SparkSQL的Hibernate方言?
- 28. hbase-indexer solr numFound不同於hbase錶行的大小
- 29. Hbase在Windows上出錯
- 30. 如何將hbase表從hbase-0.94集羣複製到hbase-0.98集羣
不會對我的問題有任何意見,它分解成 - 這是什麼原因,不是票價。 – user6608138
爲什麼你需要在Hbase表上查詢? – Avijit
您可以在Hive中創建Hbase的外部表。由於Hbase沒有構建在Hadoop文件系統之上的sql和分佈式列面向數據庫,我很懷疑您能夠在Hbase上進行查詢。 – Avijit