2015-11-11 48 views
10

我下載德國Wikipedia轉儲dewiki-20151102-頁面,文章,multistream.xml。我的簡短問題是:在這種情況下,「多流」意味着什麼?多數據轉儲維基百科

回答

11

轉儲使用bz2壓縮的,BZ2支持並行版本允許它壓縮/解壓縮速度更快的文件。使用並行版本 壓縮的數據被標記爲multistream

瞭解這些信息有差別,當你正在處理從一種編程語言轉儲,因爲你必須通過一個標誌來告訴庫如何解壓縮(平行或非平行)。

+0

可否請你回答這個問題: https://stackoverflow.com/questions/48386791/extract-related-articles-in-different-languages-using-wikidata-toolkit?noredirect=1#comment84061677_48386791 – SahelSoft