我有一個項目,我正在做數據挖掘一個大型數據庫。我目前將所有數據存儲在文本文件中,我試圖理解存儲數據關係數據庫的成本和收益。看起來像這樣:開源數據庫中行數的上限?
CREATE TABLE data (
source1 CHAR(5),
source2 CHAR(5),
idx11 INT,
idx12 INT,
idx21 INT,
idx22 INT,
point1 FLOAT,
point2 FLOAT
);
有多少點這樣我可以有合理的表現?我目前有大約1.5億個數據點,而且我可能不會超過3億個。假設我使用的是帶有4個雙核2ghz Xeon CPU和8GB內存的盒子。
供參考:你說你有一個SMP系統。因此,建議您可能會用並行請求來攻擊此問題以細分問題。不知道問題域,只是從你的個人資料中做出一些推論。 – Roboprog 2009-12-17 06:10:24