2014-10-31 67 views
0

我有創建20M行提取的問題(因爲它是一個持久的過程), 我想要一個實時連接,但因爲問題是與Amazon Redshift或數據庫設計問題報告需要很長時間在服務器上預覽。創建20M行提取物的最佳方法是什麼?

所以我要提取數據(20M行)是否有最快的方式來創建一個提取?

我按照這些步驟,沒有工作,

Method 1:

1,創建10行

2.Publish提取到服務器

3.Schedule的提取物的提取物全增量提取物

Method 2:

1,創建視圖

2.Publish認爲

3.Schedule的觀點完全刷新

請指導我在這?

+0

當你說這兩種方法都不起作用時,實際的問題是什麼?有沒有錯誤,提取不正確刷新或別的東西? – Talvalin 2014-11-02 17:14:56

+0

您可以使用Tableau Data Extract API以編程方式構建解壓縮以幫助診斷問題。 – 2014-11-02 19:43:22

+0

@Talvalin:他們都沒有工作,提取沒有發生,日程表在服務器上是成功的,例如:我創建了一行提取並計劃它,但是在計劃後(計劃成功)提取物仍然有1排,我預計將近20M行。 – 2014-11-03 02:58:42

回答

3

如果解壓縮沒有成功創建,並且需要診斷問題,則可以嘗試使用Tableau Data Extract API通過Python腳本或Java或C程序創建解壓縮。它非常簡單,可以讓您更好地控制日誌記錄和調試。

我通常會推薦第一種方法,但一定要將提取作爲數據源單獨發佈到服務器,然後讓工作簿通過Tableau Server連接到它 - 而不是將提取內嵌入一個特定工作簿。這樣,您可以獨立更新數據和工作簿。

此外,對於該大小的提取,請嘗試隱藏不需要的字段(列),過濾掉不需要的行,然後將聚合級別捲起到可視化需求最高的級別。提取物越小,性能越好。

在Tableau博客上有三篇關於Tableau數據提取的系列文章。以下是第一個: http://www.tableausoftware.com/about/blog/2014/7/understanding-tableau-data-extracts-part1

4

Alex Blakemore的答案的替代方法是在Tableau Desktop上創建一個空的提取,將該數據源發佈到Tableau Server,然後在第二天安排數據源進行刷新。

Publishing and Populating Empty Extracts

這種方法應該工作。如果沒有,請聯繫Tableau支持部門以獲得進一步的幫助(只要您有最新的維護)。

+0

如果問題是將摘錄從客戶端推送到服務器需要很長時間,那麼讓Tableau Server構建提取文件非常有用。但是,如果與原始數據源的連接失敗,則不起作用。在這種情況下,從Python腳本構建提取可能會給您一個診斷問題的機會 – 2016-10-28 01:51:40

-1

使用服務器資源發佈使用-1計數提取方法的提取。

  1. 創建您的連接,選擇提取並編輯過濾器頂部1行。
  2. 保存工作簿。
  3. 在記事本中打開工作簿,並查看文本count extract = 1
  4. 更改1-1並保存文件。
  5. 在tableau中打開工作簿並只在服務器上發佈數據源。
  6. 轉到服務器並在服務器上運行提取刷新。
  7. 完成後,連接到服務器已發佈資源的摘錄。
  8. 你很好走。
相關問題