2010-08-04 134 views
1

我想創建一個程序,用於從超大的500MB大小的XML文件生成內容。我需要在不同的時間從文件中獲取數據,但用戶願意等待一段時間,並且全部在本地機器上完成。解析,處理和使用非常大的XML文件

我womdering如果任何人有任何有關建議:

實現語言 是否X路徑是夠輕查詢的(當然是巨大的)數據庫 任何其他意見

我大概只需要使用上不到1%的數據,我不能指望事先做好處理準備文件。

任何提示?

回覆評論:我可以打開文件,但只能讀入文件,然後再寫出來。所以不是真的,基本上。我只使用這個文件一次,用xml文件中的select(和非確定性選擇)條目生成這個'content'。然後我再也不需要這個文件。

+0

你有過XML文件中的任何控制?你能把它分解成小塊嗎?你多久處理一次文件?你是否曾經多次處理同一個文件? – 2010-08-05 00:31:34

+0

你看過vtd-xml嗎? – 2010-08-10 08:13:38

回答

1

我看到這個link在計算器這在一定程度上與此有關

+0

謝謝,我也看到了。我不想去Java,但我認爲這可能是最好的選擇。我會檢查並報告回來! – mtrc 2010-08-05 10:07:22

+0

好的,那是它 - 有點。我最後決定使用Python並使用SAX解析器。我覺得我將來可能會構建一個臨時數據庫,因爲我越發展這個應用程序越多,我發現自己希望對數據進行豐富的搜索,但現在 - SAX是要走的路! – mtrc 2010-08-05 14:30:59