讓Tableau與Spark和Cassandra對話

DataStax spark cassandra連接器非常適合通過Apache Spark與Cassandra進行交互。藉助Spark SQL 1.1，我們可以使用節儉服務器與Tableau進行交互。由於Tableau可以與Spark交談，並且Spark可以與Cassandra交談，所以肯定有一些方法可以讓Tableau通過Spark（或者Spark SQL）與Cassandra交談。我無法弄清楚如何讓這個運行。理想情況下，我想用Spark Standalone集羣+一個cassandra集羣（即沒有額外的hadoop設置）執行此操作。這可能嗎？任何指針讚賞。讓Tableau與Spark和Cassandra對話

來源

2014-10-07 ashic

Tableau剛剛宣佈推出Spark SQL驅動程序http://www.tableausoftware.com/about/blog/2014/10/tableau-spark-sql-big-data-just-got-even-more-supercharged-33799 。該文章介紹瞭如何申請一個測試版本。 – 2014-10-17 02:57:29

關於讓spark + tableau查詢cassandra的任何想法？ – ashic 2015-02-17 23:12:38

由於Spark SQL可以訪問Cassandra，因此應該可以使用Tableau Spark SQL驅動程序。您使用的是測試版驅動程序嗎？如果有，你有什麼具體問題？（或者更好的是，告訴測試程序，以便他們可以修復它） – 2015-02-18 04:37:00

HiveThriftServer有一個HiveThriftServer2.startWithContext(sqlContext)選項，因此您可以創建引用C *的sqlContext和適當的表/ CF，然後將該上下文傳遞給節儉服務器。

因此，像這樣：

import org.apache.spark.sql.hive.HiveContext 
import org.apache.spark.sql.catalyst.types._ 
import java.sql.Date 
val sparkContext = sc 
import sparkContext._ 
val sqlContext = new HiveContext(sparkContext) 
import sqlContext._ 
makeRDD((1,"hello") :: (2,"world") ::Nil).toSchemaRDD.cache().registerTempTable("t") 
import org.apache.spark.sql.hive.thriftserver._ 
HiveThriftServer2.startWithContext(sqlContext)

因此而不是從星火開始默認thriftserver你可以只午飯你cusotm之一。

來源

2015-04-03 12:00:45 user4746156

讓Tableau與Spark和Cassandra對話

回答

相關問題