2016-11-05 163 views
-1

需要幫助編寫腳本豬計數無:在阿帕奇豬節目

文件,其中包含下面的文本

What|is|Hadoop 
History|of|Hadoop 
How|Hadoop|name|was|given 
Problems|with|Traditional|Large-Scale|Systems|and|Need|for|Hadoop 
Understanding|Hadoop|Architecture 
Fundamental|of|HDFS|(Blocks,|Name|Node,|Data|Node,|Secondary|Name|Node) 
Rack|Awareness 
Read/Write|from|HDFS 
HDFS|Federation|and|High|Availability 

回答

0

將數據加載到一個chararray.Replace詞的「|」與空間,即「」和記號化,這將給你的話,然後組和算的話

A = LOAD '/user/hadoop/data.txt' AS (line:chararray); 
B = FOREACH A GENERATE FLATTEN(TOKENIZE(REPLACE(line,'\\|',' '))); 
C = GROUP B BY $0; 
D = FOREACH C GENERATE group, COUNT(B); 
DUMP D; 

輸出

enter image description here

+0

從上面的代碼我得到一個輸出線字母。我想顯示單詞,然後數一數。輸出看起來像這樣:(W) (H) 的(a) (噸) (|) (ⅰ) (S) (|) (H) 的(a) (d) ( o) (o) (p)...我想以下面的方式顯示輸出(什麼),(hadoop)..可以幫助你 – Naveen