2
對不起,我是Apache Nifi的新成員。所以我做了一個關於從Hive中提取數據並將其存儲在SQL中的數據流。我的數據流沒有錯誤,唯一的問題是,它重複提取數據。將數據從Hive提取到SQL Server,無需使用Apache Nif的重複項
我的數據流是由以下部分組成:
- SelectHiveQL
- SplitAvro
- ConvertAvroToJson
- ConvertJsonTOSQL
- PutSQL
例如我在蜂巢中的表只有20行,但當我運行數據流並檢查我的MS SQL表中。它節省了5000行。 SelectHiveQL重複提取數據。
我需要做什麼,它只會拉動20行或者我的蜂巢表中的確切行數?
謝謝
太感謝你了!先生。 – Eiger