我的應用程序使用來自不同供應商的XML數據。 所有供應商都有不同的xml格式/架構,並且需要自定義查詢才能從這些XML中檢索各種數據。 (使用Woodstock StAX解析器)我從一個RDBMS方法開始,在從供應商處檢索一個特定的XML之後,我將解析/查詢XML並將數據寫入一些表中(使用Woodstock StAX解析器)。然而,由於RDBMS(固定模式)的本質,我無法支持來自不同供應商的所有XML格式,即使我這樣做,我也必須將分層xml「歸一化」爲RDBMS固定模式關係數據。XML數據庫評估
來自供應商的xml /數據每天都會經常更新,並且大小在幾kbs至50 MB的數據文件之間變化。
我正在評估各種NXD(本機Xml數據庫),eXist-db,Sedna,BaseX和MonetDB作爲下一步,看看這是否適合我的目的。
有人可以提供一些關於如何解決這個問題的實用建議嗎?或者已經構建了類似的系統,它處理大量不同格式/模式的XML數據。
這裏是核心XML要求我試圖回答:
- 處理多種XML數據文件,從多個來源。不同供應商的XML不同。
- 整個文檔的XML更新以及DB中現有XML的一些字段。
- 確定它是否來自特定供應商並據此進行查詢。
- 使用XPath/XQuery查詢這些XML以讀取數據以將其呈現給通用視圖中的用戶。
請指教。
謝謝, Subhro。