2015-11-02 71 views
0

我使用的Neo4j創建它由一個網絡數據庫:
-Taxi公司(1個節點),其包括每個城市
-cities(1000節點),其含有
-taxis(100節點/ - 總計100,000-)。

- 每輛出租車都有一個「費用」,每天計算兩次,因此每輛出租車每天有2個節點(出租車節點與其費用有關係,因爲此關係屬性是日期;因爲當我想要檢索收取費用,我會按日期匹配)
因此,每個城市將有兩個「總費用」,每個城市賺取的出租車總額計算差異。
我需要這樣做6個月(2個節點 - >每個出租車 - > 200,000 /天 - > 360,000,000費用節點),這是很多節點和大量磁盤空間存儲在硬盤上,所以我的問題:
有沒有一種方法來優化這種大型數據集的磁盤存儲?或有辦法壓縮它?優化Neo4j的磁盤使用

回答

2

您可以使用Neo4j Hardware Sizing Calculator來估計需要多少空間來存儲所有這些數據。

在這些日子裏,優化磁盤空間是沒有意義的,因爲磁盤非常便宜。

的Neo4j已經做某種壓縮的你 - http://neo4j.com/docs/stable/property-compression.html

您也可以使用文件系統的壓縮,但它會對性能帶來巨大的影響。

+0

元素大小如此之大(14B/Node,33B/Rel)有沒有一種方法可以將這些大小配置爲我在每個數據中放入多少數據? 這只是我的DB的一個子集,原件可能包含1-10M出租車,每天收費96(每15分鐘)。 –