我需要將dbpedia導入neo4j。 我從這裏下載dbpedia:http://wiki.dbpedia.org/Downloads37 任何想法?如何將dbpedia導入neo4j?
回答
或許可以從這個博客帖子得到一些幫助:http://blog.acaro.org/entry/dbpedia4neo
此用戶已經寫了一個腳本吧:
我目前在做同樣的事情。我發現最大的問題是編制索引,所以最好的解決方案是編寫一個Java程序,將md5散列語句提取爲三元文件,如下所示: subjectHash \ t predicateHash \ t objectHash \ t subject \ t predicate \ t對象\ n。
在另一個文件中,你將需要存儲節點(又名科目和報表的對象): nodeHash \ t的nodeValue
此過程中的代碼可以從我的github下載: https://github.com/eschleining/DbPediaImport.git
使用mvn包編譯它,並在目標中創建一個jar文件,該文件將gzip dbpedia文件作爲參數。如果你只有BZ2文件,你可以將他們喜歡如下: for i in *.bz2 ; do bzcat "$i" | gzip > "${i%.bz2}.gz"; done &
現在運行: java -jar ConcurrentDataTableWriter-0.0.1-SNAPSHOT.jar yourdbpediaFolder/*.gz
然後你新創建的文件手動與Linux的排序實用程序排序: gunzip -c nodes.gz | sort -k2 -u | gzip > nodes_unique.gz
和三元組文件: gunzip -c triples.gz | sort -k1,3,2 -u | gzip > triples_unique.gz
現在,您可以使用maven3(mvn軟件包)編譯我的回購的批量插件並在其中運行與nodes_unique.gz和triples_unique.gz文件具有相同的目錄,它創建一個名爲「DbpediaNe04J」的Neo4J數據庫目錄(介意拼寫錯誤「0」而不是o)。
我發現這是最快的方法,因爲它只查找三次中的每個主題/對象對的索引一次。
隨意將數據類型節點添加爲屬性等。我目前已經將每個三元組實現爲兩個節點之間的關係。
- 1. 如何將CSV導入neo4j
- 2. 如何將.zip數據導入neo4j?
- 3. 將Neo4J數據導入Gephi
- 4. 將數據集導入neo4j
- 5. Neo4j - 不能導入neo4j-import
- 6. 如何導入數據庫(檔案)neo4j
- 7. neo4j:如何從Oracle中導入數據
- 8. 用py2neo導入neo4j
- 9. Neo4j 3.0.3導入CSV
- 10. 導出和導入Json Neo4j
- 11. 將neo4j graphml導入orientdb問題
- 12. 將Neo4j數據導入Gephi 0.9.1
- 13. 將CSV關係導入到Neo4j
- 14. 將批量json數據導入neo4j
- 15. 如何將Python節點字典導入neo4j?
- 16. 如何將Wordnet導入OrientDB,Neo4j等圖形數據庫?
- 17. dbpedia/flash如何?
- 18. 將RDF/XML數據導入本地DBpedia設置
- 19. 如何將大量數據插入Neo4j
- 20. Neo4j的APOC導入錯誤
- 21. neo4j導入CSV與關係
- 22. Groovy neo4j批量導入
- 23. Neo4j CSV導入太慢
- 24. 在Netbeans中導入Neo4J API
- 25. 如何用Java導入嵌入式Neo4J中的GraphML DB?
- 26. 將Neo4j導出爲.csv
- 27. 使用Python將Graphml文件導入neo4j並將其導出爲CSV
- 28. 的Neo4j - 如何導入具有特殊字符
- 29. 如何在Windows上安裝Neo4j批量導入程序
- 30. 如何導入的Neo4j轉儲到當前數據庫
你會發現這個社會有用的答案: http://stackoverflow.com/questions/12212015/how-to-setup-neo4j-with-dbpedia-ontop-of-ruby-on-rails – 0x90
另外,我知道Kenny Bastiani在這方面做了一些工作。這似乎是一個相關的項目:https://github.com/kbastani/neo4j-dbpedia-importer –