這是我的數據集 品牌名稱其次是價格在$符號我是在豬編程,我會加載下面的數據集
Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box:
Iphone 6s 16gb rose gold factory unlocked:$280
iPhone 6s 64gb T-Mobile:$350
Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked:$385
iPhone 6s plus 64gb unlocked.:$600
,當我使用此命令加載此數據:
grunt> scrap1 = LOAD '/user/vickysmartboy15/hadoop-test1/scrap.txt' USING org.apache.pig.piggybank.storage.MyRegExLoader('([^\\:]+):([^\\:])') as (Name:chararray, price:chararray);
使用查看數據後:轉儲操作
我的結果是這樣
(Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box,$)
(Iphone 6s 16gb rose gold factory unlocked,$)
(iPhone 6s 64gb T-Mobile,$)
(Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked,$)
(BRAND NEW Apple iPhone 6S 32Gb Silver Verizon UNLOCKED Clean ESN,$)
(iPhone 6s plus 64gb unlocked.,$)
只有$
不顯示編號。
我該如何解決這個問題?
發生了什麼錯誤? – TKHN
Sry對於上一個問題,這是實際發生的事情。 – vicky15
在第一行中,':'後面沒有任何內容。沒有價格。請用正確的數據更新問題。另外,使用'PigStorage(':')'而不是使用RegEx加載器,你應該沒問題。 – philantrovert