Hadoop hive serde - 輸入格式必須實現InputFormat

我已經在SerDe上處理過我的XML數據，並且爲XML數據創建了自定義的InputFormat和RecordRedaer。Hadoop hive serde - 輸入格式必須實現InputFormat

下面是類的簽名 -

SERDE類 -

public class XMLSerde extends AbstractSerDe {

InputFormat -

public class XMLInputFormat extends FileInputFormat<LongWritable, BookWritable> { 

    @Override 
    public RecordReader<LongWritable, BookWritable> createRecordReader(InputSplit arg0, 
      TaskAttemptContext arg1) throws IOException, InterruptedException { 
     // TODO Auto-generated method stub 
     return new XMLRecordReader(); 
    }

RecordReader -

public class XMLRecordReader extends RecordReader<LongWritable, BookWritable> {

BookWritable是自定義Wr的我創造的可愛的類。

現在，當我使用下面這個SERDE -

CREATE TABLE xml_items(Author STRING, Title STRING, ISBN STRING) ROW FORMAT SERDE 'com.xml.serde.XMLSerde' STORED AS INPUTFORMAT 'com.xml.serde.XMLInputFormat';

我得到以下錯誤，同時運行在該表上選擇查詢。

FAILED: SemanticException 1:14 Input format must implement InputFormat. Error encountered near token 'books'

請建議。 AJ

來源

2015-10-20 AJ84

任何幫助，請... – AJ84

Hive只支持舊的mareduce API。您應該從org.apache.hadoop.mapred.FileInputFormat類繼承XMLInputFormat。

來源

2015-10-20 15:31:24 user1901550

好的，讓我試試這個。感謝您的快速響應。 – AJ84

我仍然遇到同樣的問題... – AJ84

不知道它是多麼可讀 - 'package com.xml.serde; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.mapred.FileInputFormat; import org.apache.hadoop.mapred.JobConf; import org.apache.hadoop.mapred.Reporter; import org.apache.hadoop.mapred。*; 公共類XMLInputFormat延伸FileInputFormat { \t @Override \t公共RecordReader getRecordReader（ \t \t \t InputSplit爲arg0，JobConf ARG1，記者ARG2）拋出IOException異常{ \t \t返回新XMLRecordReader（arg1，（FileSplit）arg0）; \t} }' – AJ84

Hadoop hive serde - 輸入格式必須實現InputFormat

回答

相關問題