我知道live.dbpedia.org更接近dbpedia.org數據的實時版本,但這引起了一個問題:常規dbpedia提取/更新過程運行的頻率如何?數據轉儲多久更新一次?另外,據說主要端點除了維基百科提取的內容之外還包含其他數據集。live.dbpedia.org,dbpedia.org和dbpedia數據轉儲之間的數據差異是什麼?
dbpedia.org,live.dbpedia.org和數據轉儲之間的數據有什麼不同?
我知道live.dbpedia.org更接近dbpedia.org數據的實時版本,但這引起了一個問題:常規dbpedia提取/更新過程運行的頻率如何?數據轉儲多久更新一次?另外,據說主要端點除了維基百科提取的內容之外還包含其他數據集。live.dbpedia.org,dbpedia.org和dbpedia數據轉儲之間的數據差異是什麼?
dbpedia.org,live.dbpedia.org和數據轉儲之間的數據有什麼不同?
我做了一些研究DBpedia中的一個項目,我會和大家分享我發現:
http://dbpedia.org/sparql:此端點使用的大多數數據集從DBpedia Downloads 2014(WayBackMachineLink)。有關其正在使用的數據集的完整列表以及更多信息,請訪問此站點:Datasets Loaded 2014(WayBackMachineLink)。那麼下載更新的頻率如何?請參閱下載的changelog。
http://live.dbpedia.org/sparql:該終點正在使用來自DBpedia live的數據。如果你看看live changesets,你可以看到有時它至少每小時更新一次,有時像在2014年9月每月只更新一次。 DBpedia中是怎麼說的:
問:DBpedia中的實時更新(變更)具有結構年/月/日/小時/ xxxx.nt.gz。這是什麼意思,如果兩者之間有差距,例如某個小時的文件夾丟失了?
答:這意味着服務在當時已經關閉。
而且DBpedia live - 3. new features(WayBackMachineLink)說:
同步工具的5. 發展:同步工具使DBpedia的現場鏡保持同步與我們的生活端點。它依次下載變更集文件,解壓縮它們,並將它們與另一個DBpedia Live鏡像集成。
所以我認爲,如果您在應用變更集時與實時終端節點同步,那麼實時終端節點也將應用變更集。
你能澄清這個問題嗎?在「其中有些行爲不一樣」不會告訴我們你看到了什麼差異。 [DBpedia Live](http://wiki.dbpedia.org/DBpediaLive)說,「DBpedia被認爲是維基百科的語義網鏡像,隨着時間的推移,維基百科的文章被修改,這使DBpedia中的數據過時。 DBpedia Live將保持DBpedia始終與維基百科同步。「除此之外還有更多嗎? – 2014-10-03 17:55:28
@JoshuaTaylor這個問題當然更多。所以我試圖重寫整個問題。也許現在它已經更新了,你可以看到我困惑的東西。 – Kristian 2014-10-03 18:28:03