35

我的公司大量投資MS BI Stack(SQL Server Reporting Services,分析服務和集成服務),但我想看看看似最受關注的開源替代Pentaho就像。Pentaho vs Microsoft BI Stack

我已經安裝了一個版本,並且我非常輕鬆地完成了它。這很好。但我沒有真正的時間開始使用它來進行實際工作,以便徹底瞭解包裝。

有沒有人對Pentaho vs MS BI有什麼看法,或者有什麼比較的鏈接?

非常感謝!

回答

50

我檢查了多個Bi堆棧,以便從Business Objects下載路徑。我的很多評論都是偏好的。這兩套工具都非常出色。有些事情是我比較喜歡純巧克力的巧克力軟糖布朗尼冰淇淋。

Pentaho有一些非常聰明的人與他們合作,但微軟一直在資金和計劃良好的道路上。請記住,MS仍然是數據庫市場中的弱者。甲骨文在這裏是國王。爲了提高競爭力,當你購買數據庫並被迫重新發明他們的平臺幾次時,MS一直在贈送很多好東西。我知道這不是關於數據庫,但數據庫戰爭導致MS爲了給他們的堆棧增加價值而放棄了很多。

1.)平臺
SQL服務器不能在Unix或Linux上運行,因此它們會自動從該市場中排除。 Windows現在與一些版本或Unix的價格大致相同。 Windows相當便宜,現在運行良好。它給了我像Linux一樣多的麻煩。

2.)OLAP
分析服務於2005年(當前是2008年)在2000版本中重新創建。這是一個在2000年以上更強大的秩序。一旦你變大,pentaho(蒙德里安)就不會那麼快。它也有一些功能。這是相當不錯的,但工具的方式較少。這兩個都支持Excel作爲一個非常重要的平臺。 MS版本更強大。

3.)ETL
MS-DTS已被替換爲SSIS。再一次,巨大的秩序增加了速度,力量和能力。它控制任何和所有的數據移動或程序控制。如果它不能這樣做,你可以在Powershell中編寫腳本。與2008版本中的Informatica一致。 Pentaho - 比過去好得多。沒有我想要的那麼快,但我能做的只是我想做的一切。

4.)儀表板
Pentaho改進了這一點。這對開發來說是不舒服和不友好的,但對於MS來說確實不是一個真正的等值。

5.)報告
MS報告確實很強大,但並不是很難使用。我現在喜歡它,但一開始就討厭它,直到我對它有了更好的瞭解。我一直在使用水晶報告,MS報告生成器功能更強大。在MS中做很難的事情很容易,但是做一些簡單的事情有點困難。 Pentaho有點笨拙。我根本不喜歡它,但你可能會。我發現它過於複雜。我希望它更像Crystal報表生成器或MS報表生成器,但它是碧玉。我覺得很難。這可能是一種偏好。

6.)ad hoc
MS - 這是我真正的贏家。我與我的用戶一起測試了他們,他們立即愛上了MS用戶報告生成器。造成這種差異的原因是它不僅易於使用,而且具有生產力。 Pentaho - 很好,但很漂亮的老派。它使用更典型的基於嚮導的模型,並具有強大的工具,但我討厭它。它是一個很好的工具,但是我們已經從這種風格中走了出來,沒有人想回去。我與logiXML有同樣的問題。界面對於它的運行情況非常好,但與我們使用12年的時間並沒有太大的變化。 http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

有一些經驗豐富的人可以使Pentaho真正運行良好,我只是發現MS套件更高效。

+0

優秀和寫得很好,謝謝! – Tomas 2008-10-01 17:37:38

+0

Stradas,你正在爲所有的社區提供很好的信息。寫得很好,由於你自己的偏好和內容的組織結構,你對於可能不準確的事情的警告提供了一個很好的參考點。感謝您抽出寶貴的時間。 – vmarquez 2008-10-30 23:00:56

+0

NagaMensh,你能更具體嗎?與DTS相比,學習曲線有點長,但我發現SSIS是一個深思熟慮的工具。 Informatica是最接近的比較。還有其他好用的工具也很容易使用,但其中大多數工具不夠健壯。 – Stradas 2009-04-14 20:59:56

3

我無法在MS BI Stack上提供任何輸入信息,但在最近的Barcamp Orlando上,來自Pentaho的人員在那裏並談論他們的產品,這是一個非常令人印象深刻的演示。

事實上,這是一個開源項目,您可以擴展自己以及付費套餐以獲得真正的良好服務,這爲您提供了很多選擇。他們展示了一些他們爲客戶做的有償工作,他們確實讓人羣振奮。

我也有機會與Pentaho的數據倉庫方面的開發人員聊一聊,他非常敏銳,對建議非常開放,並且沒有問題回答任何問題。

因此,就公司而言,Pentaho對他們的工作以及他們所有開發人員的友好和平易近人都給我留下了深刻的印象。

0

如果你正在尋找一個強大的,低成本的替代大男孩LogiXML有一個.NET平臺的儀表板和臨時報告。自2006年底Pentaho剛剛起步以來,我們一直在使用它們,但我沒有在一段時間內看過它。

4

許多年前我開始使用MS Reporting Services,並且很喜歡它。我沒有嘗試過Penaho的報告解決方案,所以我不能評論它。我也沒有嘗試過Analysis Services或Pentaho的替代方案。

最近我需要一個ETL解決方案,並熟悉MSSQL和MSRS,看起來很明顯,我會審查並可能選擇MS Integration Service。但對我而言,MSIS非常糟糕。主要是因爲它不直觀。花了幾天的時間嘗試學習這個工具之後,我決定尋找替代方案,並且遇到了Pentaho數據集成,以前稱爲Kettle。我在幾分鐘內完成並運行,並立即創建了我的第一個轉換。它只是工作。

不可否認,我的需求相當簡單,但表現非常好,社區似乎非常有幫助。

8

警告 - 有許多網站列出了許多缺陷,錯誤和SSIS的煩惱。不知道爲什麼SSIS在帖子的頂部出現 - 但是在你將它打上項目之前,看看人們在博客圈裏要說些什麼。從我的經驗來看,它大約20:1咆哮SSIS是多麼可怕的工作 - 我可以同意,目前正在尋找任何替代方案。

0

我最近嘗試了pentaho開源BI。我發現它非常笨拙。這不是很直觀,開發時間花費更長時間。

它與Oracle或ms BI解決方案完全不同。也許企業版更好。

4

我已經使用了SSIS和Pentaho Kettle,我強烈推薦使用Pentaho Kettle作爲ETL工具而不是SSIS。我的理由: - SSIS的流程是任務到任務水壺讓您考慮流經系統的數據行。水壺的方法似乎對我來說更直觀。 -SSIS記錄不完整。有時候是這樣的。但似乎有很多點擊和設置變量。非常複雜。 Pentaho有一個非常有幫助的社區論壇。 - 我信任Pentaho集成多種類型的數據庫,包括SQL Server。你也可以使用很好的JDBC。另外,我使用它在SQL Server和Oracle之間以及Vertica之間。它在Vertica上有一個散裝加載程序。這很好。 - 我發現它非常非常難以獲得SSIS包在服務器上運行。這只是我的時間不值得。 - 我發現Pentaho很容易發送警告或錯誤信息給一個人或一系列人員。 -Pentaho允許在JavaScript中完成需要某些邏輯的任務。用我們大多數人遇到的語言簡單和容易地完成。

7

了不起的信息在這裏?我沒有嘗試Pentaho,但計劃檢查出來。我是一位經驗豐富的MS BI顧問,自1998年以來一直使用它。SSIS速度非常快,而且非常強大,但批評很現實。我發現SSIS存在以下問題:

(1)這很難調試,你會得到一些神祕的錯誤,可能不會給你提示什麼以及問題的真相。

(2)根據之前的評論,這是史上最糟糕的開發環境!我不知道他們在想什麼。 (a)創建一個包含100列或更多列的表格,並在其上放置一個合併連接。現在回去嘗試對合並連接進行更新(就像拉一個新列一樣)。在合併連接上單擊確定後,即使在最快的機器上,也可能需要幾分鐘時間才能保存更改。我有一個巨大的數據流,有很多寬的記錄和許多合併連接。向數據流添加一列需要超過半天。我更新了一個合併連接,然後必須執行其他操作,並在5-10分鐘後再檢查它是否完成。微軟對此的迴應是將你的軟件包分解成多個軟件包,將數據放置在一個表格或二進制文件中。那麼如果你要在所有步驟之間進行磁盤操作,那麼你可能會在SQL中做好所有事情! ETL工具的一個主要目的是將所有這些東西存儲在內存中並避免磁盤I/O。

(二)設計徹底崩潰有時,失去了所有的工作自上次保存(我做CTRL-S在我睡覺的,因爲現在這個)

(三)我必須想出一個黑客併產生SSIS在Excel中打包XML以獲得廣泛的記錄。我有一個醫療保健客戶,其中600多列記錄是司空見慣的。如果您嘗試在SSIS中定義一個包含600列的文件格式,則必須一次一個地鍵入每一列!即使MS訪問也允許您將電子表格中的佈局剪切並粘貼到文件佈局中,而不是SSIS。所以我必須從佈局中生成XML,並將XML代碼粘貼到包中的正確位置。醜陋的做法,但它節省了整天的工作和很多錯誤。 (d)與(c)類似,如果您需要修剪所有列,並且您說有600多個列,請猜猜看是什麼?在派生列組件中,您必須輸入trim(column1)600次以上!我現在在SQL查詢中執行所有這樣簡單的轉換來獲取數據,因爲這可以很容易地從Excel工作表生成。 (e)有許多古怪的東西,組件變得不可見,有時你打開包裝,所有的組件都被無條理地重新排列。(f)FTP功能可能是您在ETL中最常見的東西之一,它很薄弱,只支持無人使用的普通香草FTP。現在每個人都使用SFTP,FTPS,https等......因此,幾乎每個實現都需要使用該包必須調用的第三方commend行驅動文件傳輸應用程序。 (g)嘗試使用CYA,類似於Windows Vista中荒謬的安全性,微軟使得將SSIS包從一個環境推向另一個環境變得極其困難。它默認使用「用用戶密鑰加密敏感信息」這種愚蠢的做法,這意味着它必須在您將它移動到的環境中的相同帳戶下運行,以此爲開發環境,這種情況很少出現。有更好的方法來配置,但它總是試圖恢復到這種完全無用的安全保護。 (h)最後,這些問題中的大多數現在都在第三版中,清楚地表明微軟沒有計劃解決這些問題。 (i)調試幾乎不像其他語言那麼容易。

SSIS仍然有很多好處,但不是沒有一些嚴重的痛苦。

3

幾個百分點的加

  • 雖然所有的Pentaho工具在Windows中設置是繁重的窗口版本。 Pentaho(特別是與GUI工具分開的服務器啓動和停止)通常用於Linux,而不是Windows商店,並且從Windows到Linux的學習曲線陡峭。
  • 當你轉向它時,任何工具都有學習曲線。當你習慣於總是點擊確定並在遇到問題時刷新元數據時,SSIS並沒有那麼糟糕。 Pentaho也可以是片狀的。

工具問題需要解決更大的文化問題 - 什麼樣的商店使用開源工具?根據我的經驗,我發現微軟商店似乎更加僵化,當你在微軟商店的連接字符串出現問題時,你可以獲得幫助。在Pentaho和Linux中,它更多地使用DYI。

順便提一下,小心Pentaho銷售人員在做演示 - 他們展示的所有東西都比看起來難以工作! :)