2013-10-06 37 views
0

我不清楚分區和分區之間的區別,如果你可以提供一些例子的細節,真的很感激。配置單元中的分區和分區有什麼區別?

+1

看看這個問題http://stackoverflow.com/questions/19128940/what-is-the-difference-between-partitioning-and-bucketing-a-table-in-hive/19131221#19131221 –

回答

7

Here桶和分區之間是一個很好的區別。

基本上,分區和Bucketing基本上比執行查詢的數據更有效地比非切片數據。主要區別在於,在數據被修改的情況下,在分區的情況下片的數量將保持變化,但是具有分區的片的數量是固定的,其在創建表時被指定。

Bucketing通過使用哈希算法,然後模塊桶的數量發生。所以,一行可能會插入到任何存儲桶中。 Bucketing可用於數據採樣,也可用於更有效地連接兩個數據集。

相關問題