2017-02-27 65 views

回答

2

的GetHBase處理器被製成從基於時間戳的HBase的表做增量提取。初始時間範圍屬性確定最小時間是從0還是在當前時間開始,之後處理器正在跟蹤上次執行中看到的最大時間,並將其用作下次執行中的最短時間。所以你不能提供你自己的時間範圍,因爲處理器正在爲你管理。

1

GetHBase處理器總是根據時間戳尋找增量更新。基本上它會自動識別新的/更新的數據。

但是,如果你仍然想專門爲時間戳(S)逐行讀取,你必須在標籤「篩選表達式」下面的格式使用正則表達式:

TimeStampsFilter(timestamp1,timestamp2 .... timestampn)

您可以在以下位置找到這些過濾器的列表:https://www.cloudera.com/documentation/enterprise/5-3-x/topics/admin_hbase_filtering.html