2016-07-25 35 views
2

我們有一個看起來像這樣的文件:Azure的數據倉庫多鹼文件格式

Col1,Col2,Col3,Col4,Col5 
"Hello,",I,",am",some,data! 

因此它具有以下「屬性」:

  • 逗號分隔
  • 雙引號列分隔符
  • 某些列中的逗號

現在,我不確定實際上是否可以用PolyBase攝取這些信息,但是想知道是否有辦法?

我們目前看到的錯誤是「Could not find a delimiter after quote」 ..我的猜測是因爲雙引號被擊中的是一個預期的分隔符。經過

這是我們當前的文件格式,完整性:

CREATE EXTERNAL FILE FORMAT Comma 
WITH (FORMAT_TYPE = DELIMITEDTEXT, 
     FORMAT_OPTIONS(
      FIELD_TERMINATOR = ',', 
      STRING_DELIMITER = '"', 
    ) 
) 

回答

1

用十六進制指定它。

STRING_DELIMITER = '0x22' 

(基於有人在的https://msdn.microsoft.com/en-au/library/dn935026.aspx末尾描述的問題)加入一箇中間步驟以從CSV到ORC格式文件轉換到底排序這一點

+0

部分正確,但我仍然有問題的事情,所以去了最後的ORC格式,ty! – m1nkeh