2016-08-03 60 views
0

我正在開發一個軟件系統(Graph Database)來研究多個組件之間的互連。最終可能會產生大約30 TB的數據。我想知道在選擇正確的數據庫時需要考慮的因素。在爲30 TB數據選擇Graph DB時需要考慮哪些因素

我看的一些選項是Apache Giraph TitanDB。我也想知道是否像neo4j或OrientDB這樣的小規模數據庫本身可能會工作

回答

5

這是一個非常寬泛的問題,所以我會準確定義您要查找的內容,因爲大小可能有點模糊。

我認爲你提供的任何示例圖形數據庫都可以對大型數據建模。

幾個「更詳細」的問題,你可以問自己包括:

  1. 你關心Horizontal Scaling如果是的,那麼你應該看看TitanDB,OrientDB或DSE Graph,因爲Neo4J(在編寫本文時)不會水平伸縮,所以它受服務器大小的限制。
  2. 標準化語言查詢/遍歷語言是否重要? 如果是的,那麼也許你應該更多地關注Tinkerpop供應商,比如TitanDB,OrientDB,DSE Graph等等。如果沒有,那麼任何選項都適合你。
  3. 我的數據是否有超級節點? 如果是,那麼你應該看看每個供應商如何處理超級節點。一些供應商shard,其他供應商使用巧妙的圖形分區算法。
  4. 你需要多少支持? 如果你需要很多,那麼也許你應該看看強大的企業解決方案,如DSE,OrientDB或Neo4J。 Neo4J目前被認爲是最流行的圖形數據庫,並且擁有龐大的支持基礎。
  5. 你想使用開源軟件嗎? 如果是那麼TitanDB,Neo4j的,或者OrientDB可能是你

這些都只是一些的東西,你可以看看使所有的供應商之間更好的決定時進入。 備註:還有很多其他供應商可以考慮,Blazegraph,HypergraphDB,僅舉幾例。

+0

謝謝Felipe ... – pjesudhas

+1

Neo4j也是開源的。 GPLv3的 – Nerrve

相關問題