2014-10-07 77 views
3

DataStax spark cassandra連接器非常適合通過Apache Spark與Cassandra進行交互。藉助Spark SQL 1.1,我們可以使用節儉服務器與Tableau進行交互。由於Tableau可以與Spark交談,並且Spark可以與Cassandra交談,所以肯定有一些方法可以讓Tableau通過Spark(或者Spark SQL)與Cassandra交談。我無法弄清楚如何讓這個運行。理想情況下,我想用Spark Standalone集羣+一個cassandra集羣(即沒有額外的hadoop設置)執行此操作。這可能嗎?任何指針讚賞。讓Tableau與Spark和Cassandra對話

+0

Tableau剛剛宣佈推出Spark SQL驅動程序http://www.tableausoftware.com/about/blog/2014/10/tableau-spark-sql-big-data-just-got-even-more-supercharged-33799 。該文章介紹瞭如何申請一個測試版本。 – 2014-10-17 02:57:29

+0

關於讓spark + tableau查詢cassandra的任何想法? – ashic 2015-02-17 23:12:38

+0

由於Spark SQL可以訪問Cassandra,因此應該可以使用Tableau Spark SQL驅動程序。您使用的是測試版驅動程序嗎?如果有,你有什麼具體問題? (或者更好的是,告訴測試程序,以便他們可以修復它) – 2015-02-18 04:37:00

回答

3

HiveThriftServer有一個HiveThriftServer2.startWithContext(sqlContext)選項,因此您可以創建引用C *的sqlContext和適當的表/ CF,然後將該上下文傳遞給節儉服務器。

因此,像這樣:

import org.apache.spark.sql.hive.HiveContext 
import org.apache.spark.sql.catalyst.types._ 
import java.sql.Date 
val sparkContext = sc 
import sparkContext._ 
val sqlContext = new HiveContext(sparkContext) 
import sqlContext._ 
makeRDD((1,"hello") :: (2,"world") ::Nil).toSchemaRDD.cache().registerTempTable("t") 
import org.apache.spark.sql.hive.thriftserver._ 
HiveThriftServer2.startWithContext(sqlContext) 

因此而不是從星火開始默認thriftserver你可以只午飯你cusotm之一。