我想知道是否有一個數據結構經過優化,可以對存儲在數據庫表格式格式中的數據進行頻率計數。例如,數據以下面的(逗號)分隔格式顯示。以數據庫表格式格式計數頻率的數據結構
col1, col2, col3
x, a, green
x, b, blue
...
y, c, green
現在我只想計算col1 = x或col1 = x和col2 = green的頻率。我一直在數據庫表中存儲數據,但在我的分析和經驗觀察中,數據庫連接是一個瓶頸。我也嘗試過使用內存數據庫解決方案,並且工作得很好;唯一的問題是內存需求和奇怪的init/destroy調用。
另外,我主要與java工作,但與.net的經驗,並想知道是否有任何API與linq方式使用java中的「表格」數據工作。
任何幫助表示讚賞。
如何使用數據庫?有了正確的查詢數據庫應該適合你正在做的事情...... – 2011-01-13 05:01:22
我只是創建一個數據庫表。我知道有很多方法可以優化查詢(即使用索引),但是它們不同於數據庫和數據庫。此外,由於在運行時算法確定哪些列是相關的,因此無法知道要創建哪些索引(哪些列或列組合)。此外,該程序接受任何表格數據集作爲輸入,所以我在運行時創建數據庫表。 – jake 2011-01-13 19:20:34