2014-09-25 100 views
1

我有Tableau的個人許可證。我正在使用它來連接到.csv和.xlsx文件,但遇到了一些問題。Tableau TDE或直接連接到文件?

1)該.csv文件是大量的(10+演出) 2)Excel文件開始到到達1mil的行限制 3)我需要某些列有時添加到該.csv文件(如唯一的ID和一些公式),這意味着我需要在Excel中打開它們的一部分,修改我需要的內容,然後保存一個新文件

爲每個這些文件創建一個提取然後連接Tableau工作簿提取而不是文件?目前我直接連接到文件,然後從那裏提取數據並每天刷新。

+0

「我直接連接到文件,然後從那裏提取數據並每天刷新。」這個聲明意味着你已經在使用解壓縮文件,所以我不確定問題是什麼。 – Talvalin 2014-09-26 09:33:18

+0

我的儀表板都指向excel或csv文件。他們每人分別提取數據。我想知道是否應該爲每個文件創建一個提取文件,維護這些提取文件,並將我的工作簿指向提取文件而不是單個文件 – trench 2014-09-26 12:52:37

+0

如果問題是「我會在使用提取文件的10個以上演出文件中看到更好的性能」文本文件?「,那麼答案几乎肯定是的。 – 2014-09-26 18:27:34

回答

2

我不知道其他人,但我正在使用這個準則。我將製作一些工作手冊,僅用於從某些數據源(不管是SQL,xlsx,csv,mdb還是其他任何數據源)提取數據,並且所有分析都將在其他工作簿中執行,這些工作簿僅會連接到tdes

的優點是:

1)當你需要更新數據源,你只需要更新一次(和替換TDE文件)和所有工作簿將是最新的。如果連接到相同的數據源並提取到不同的tde文件,則必須提取所有這些不同的tde文件(並且擔心已經更新了該特定工作簿中的提取文件)。即使你提取到相同的tde(這沒有多大意義),它可能會令人困惑(我是否連接到tde或文件?我在另一個工作簿中提取的提取是否也更新了這個? ,是的,但它可能會造成混淆)

2)您不必擔心替換數據源,特別是當它是csv,xlsx或mdb文件時。你可以保留這些文件的許多不同版本,並選擇哪一個最好。例如,我將有table_v1.mdb,table_v2.mdb,...和一個table_v1.tde,它將是這些mdb文件之一的提取。而且我仍然有以前的版本,以防我需要它們。 3)當你有一個SQL連接或者任何不是文件(csv,xlsx,mdb)的東西時,基於上述基本相同的原因,提取非常方便,至少有一個優點。每次要執行分析時都不需要連接到服務器。這意味着您可以將所有內容都離線執行,並且使用Tableau的人員無需訪問SQL表(或任何其他來源)。更新時,TDE(因爲,倒楣的事情發生)

1

萬兆CSV,哇

一個很好的做法是始終保持備份。是的,你應該絕對使用數據提取,這會更快。對於那麼多的數據,你可以查看其他連接,如MS Access或SQL實例。

如果你的數據有很多行,我會嘗試在你的本地機器上設置一個小的MySQL實例,並保留那裏的數據。您可以將Tableau直接連接到MySQL實例,並且可以輕鬆編輯源數據。