2014-10-03 61 views
1

我知道live.dbpedia.org更接近dbpedia.org數據的實時版本,但這引起了一個問題:常規dbpedia提取/更新過程運行的頻率如何?數據轉儲多久更新一次?另外,據說主要端點除了維基百科提取的內容之外還包含其他數據集。live.dbpedia.org,dbpedia.org和dbpedia數據轉儲之間的數據差異是什麼?

dbpedia.org,live.dbpedia.org和數據轉儲之間的數據有什麼不同?

+1

你能澄清這個問題嗎?在「其中有些行爲不一樣」不會告訴我們你看到了什麼差異。 [DBpedia Live](http://wiki.dbpedia.org/DBpediaLive)說,「DBpedia被認爲是維基百科的語義網鏡像,隨着時間的推移,維基百科的文章被修改,這使DBpedia中的數據過時。 DBpedia Live將保持DBpedia始終與維基百科同步。「除此之外還有更多嗎? – 2014-10-03 17:55:28

+0

@JoshuaTaylor這個問題當然更多。所以我試圖重寫整個問題。也許現在它已經更新了,你可以看到我困惑的東西。 – Kristian 2014-10-03 18:28:03

回答

4

我做了一些研究DBpedia中的一個項目,我會和大家分享我發現:

問:DBpedia中的實時更新(變更)具有結構年/月/日/小時/ xxxx.nt.gz。這是什麼意思,如果兩者之間有差距,例如某個小時的文件夾丟失了?

答:這意味着服務在當時已經關閉。

而且DBpedia live - 3. new featuresWayBackMachineLink)說:

同步工具的

5. 發展:同步工具使DBpedia的現場鏡保持同步與我們的生活端點。它依次下載變更集文件,解壓縮它們,並將它們與另一個DBpedia Live鏡像集成。

所以我認爲,如果您在應用變更集時與實時終端節點同步,那麼實時終端節點也將應用變更集。

相關問題