2016-11-04 63 views
0

我一直在試圖驗證通過豬從平面文件中獲得的數據的數據類型。如何驗證豬的數據類型?

一個簡單的CAT可以做到這一點,但平面文件是巨大的,他們有時包含特殊字符。

我需要從文件中過濾掉包含特殊字符的記錄,以及當數據類型不是int時。 有什麼辦法可以在豬身上做到這一點? 我正試圖在這裏找到getType().getName()這種java的用法的替代品。

強制執行模式並使用Describe是我們在加載數據時所做的事情,然後刪除未命中匹配,但無論如何都不會強制執行模式。

任何建議將有所幫助。

回答

0

將數據加載到一個線:charraray和使用正則表達式來過濾掉包含數字以外的字符記錄

A = LOAD 'data.txt' AS (line:chararray); 
B = FILTER A BY (line matches '\\d+$'); -- Change according to your needs. 
DUMP B;