2010-06-18 91 views
12

我被分配到發展上,我們會得到一個XML從多個源(百萬XML),並把它們像一些數據庫,並從XML我會收到判斷一個系統,並且不會有任何即使它們來自同一個來源也是混凝土結構。有了這個原因,我認爲我不能建議RDMS,並且目前正在查看NoSQL數據庫。我們需要一個可以執行CRUD並且快速讀取的系統。最好的基於XML的數據庫

我一直在尋找在MarkLogic而存在,這兩者都是基於XML的NoSQL數據庫,有沒有人曾與他們的經驗?和其他建議?由於

+5

我覺得討論這個話題有建設性的,因爲我面臨着類似的問題...也許這不是建設性的,以你的代碼猴,不包括社會的其餘部分。爲什麼審查? – Boltimuss 2014-02-19 18:54:17

回答

5

我只是在尋找類似的東西。並發現有特殊的XML數據庫正是這樣做的。

看看這裏:Wikipedia

我發現,這個人是相當不錯的:Sedna

+0

謝謝你也看看這個 – monmonja 2010-07-15 12:26:37

0

即使XML不具有特定結構,只要它驗證XML,你可以仍然基本上是寫出來的DOM將其存儲在傳統的SQL數據庫。您將擁有元素和屬性的表格。元素和屬性將具有一個父元素的外鍵列和一個名稱列。

你說你需要快速閱讀。你究竟在讀什麼?如果您要查找特定的標籤,那麼傳統的SQL數據庫仍然可以很快查詢。

+0

會有一個人的XML文件,其中有很多他/她的細節,這些XML可以從每個xml 12KB - 50KB,我需要在xml本身搜索的東西。我在考慮把它們放到一個XML字段中,並從表中選擇*,其中像'%%'這樣的詳細信息很慢,特別是如果它達到數百萬條記錄(在2-3個月後情況確實如此) ?我是否對此感興趣?謝謝 – monmonja 2010-06-19 11:52:06

+0

XML是否完全沒有一致的結構?即使每個文件之間有一個或兩個標籤相同,這將有助於在列之間分隔數據並加快查詢速度。這些「多個來源」嗎? – Reinderien 2010-06-19 15:19:43

+0

我認爲一個或兩個標籤會被分開是一個好主意,謝謝。在多個來源中,有一個來自多個公司的XML數據,我們從中獲取數據。公司進一步在一個公司可能會有所不同(從國家分公司到國家分公司)無論如何,堅持傳統數據庫是你的建議嗎?非常感謝 – monmonja 2010-06-20 15:24:50

0

我沒有任何與它的實踐經驗,而且我已經閱讀了IBM DB2具有special XML capabilities

SQL Server有一個XML字段類型,但是當你有一個表等領域產生一些限制。一個煩人的(對我來說)是,你不能在鏈接的服務器上使用這樣的表。

1

你是正確地說,RDBMS不會達到目的即使它現在支持XML數據類型。我在MarkLogic中有廣泛的工作,到目前爲止它是最好的NoSQL XMl DB。我也嘗試過eXist,但是它對生產的使用沒有多大的可擴展性。 MarkLogic通過集成的應用服務器和搜索引擎爲開發人員提供了靈活性。目前它在一些大型出版社中提供了TB級的XML數據。