2011-06-06 64 views
0

目前我正在做一些實驗,這使得利用維基百科的文章。 維基百科轉儲文件約爲30GB。有工具可用(最好是PHP)或一些腳本,可以將這個整個大文件分成塊(每個文章一個xml文件)?分裂維基百科轉儲文件分成幾個XML文件

回答

0

我建議你使用優秀XMLReader,它允許您閱讀節點的XML文件的節點,而不是整個文件加載到內存第一。

您仍然可以瀏覽與DOM或SimpleXML的節點後!