2017-07-28 51 views
0

我的數據管道 - >從Web服務器獲取UTF-8編碼的數據

Web服務器 - >資料擷取通過管道 - > Solr的

在Nifi利用GetHTTP處理器,我從讀書Web服務器。處理器正在與Accept Content-Type = content-type: text/plain; charset=utf-8合作。但是,當我在Solr中加載這些內容時,我會看到奇怪的字符。

當文件是通過瀏覽器下載(從服務器上),我看到了一個不同的一組奇怪的字符(包括在瀏覽器窗口,並在諸如記事本編輯++)

橫跨整個管道,我有工作僅限UTF 8字符集。

有什麼能看到Solr中,瀏覽器和下載的文件不同人物的理由(記事本++ - 編碼成UTF-8)

+0

GetHTTP後可以存儲文件(PutFile)併發布有問題嗎?你也說過你可以用瀏覽器下載文件。你可以比較文件嗎?或發佈第二個文件.. – daggett

回答

0

我用InvokeHTTP代替GetHTTP或任何其他處理器做一些類似的HTTP動作。 調用HTTP雲幫助您瞭解詳細信息。使用此處理器並將響應保存在文件中共享我們雲幫助您的這個文件。或者您可以更改處理器中的調試lv,然後查看日誌。