2017-07-18 95 views
1

我正在學習Amazon Redshift。聽說它是雲上非常強大的存儲,並且在需要聚合操作的數據上工作得非常快,因爲它按列存儲數據。Amazon Redshift中的列式數據庫查詢

我無法找到任何示例查詢?有人可以與我分享在Amazon Redshift上運行的彙總查詢的一些示例嗎?它與正常的關係數據庫查詢有什麼不同?

回答

4

你是對的 - Amazon Redshift是一個柱狀數據庫。這意味着數據存儲在磁盤每列,使得在列上的操作非常快。例如,在Country列中爲特定值添加Sales列僅需要訪問兩列而不是表中的所有列。

其它好處是,在紅移數據是壓縮(與柱狀概念運作良好,因爲每列使用基於存儲的數據自身的壓縮方法),事實上,它是一個集羣數據庫,因此可以通過添加額外的節點來縮放計算和存儲。

亞馬遜紅移提出了自己作爲一個PostgreSQL數據庫,所以你只需使用行業標準的SQL查詢數據。不需要更改查詢。

但是,您可以通過明智地選擇爲每個決定數據分佈在節點表分發密鑰優化紅移,並仔細選擇排序鍵,這就決定了數據如何存儲在每個節點上。簡而言之,數據應按照JOIN表分配,並按照WHERE語句中的用法排序。

至於樣品查詢 ......它完全取決於您的數據!查詢看起來與正常SQL完全一樣。