在新的API(apache.hadoop.mapreduce.KeyValueTextInputFormat)中,如何指定分隔符(分隔符)而不是tab(默認值)來分隔鍵和值。如何在Hadoop -.20 api中指定KeyValueTextInputFormat分隔符?
樣品輸入:
one,first line
two,second line
輸出繼電器要求:
Key : one
Value : first line
Key : two
Value : second line
我指定KeyValueTextInputFormat爲:
Job job = new Job(conf, "Sample");
job.setInputFormatClass(KeyValueTextInputFormat.class);
KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));
這是爲選項卡作爲分隔符正常工作。
接受的答案是不正常工作 – 2014-09-29 09:36:27
@SreeVeni它對我來說很好。 – 2015-01-19 09:36:28