Univocity - 如何將3（n）行解析爲一行（bean）

我正在爲我的一個項目評估Univocity解析器，固定寬度的平面文件格式從三個詳細記錄中創建一個記錄（Bean） AA，BB，CC） - 該文件是否可以使用Univocity進行解析？
我可以使用recordEndsOnNewline繼續閱讀並添加一些自定義轉化，但是有沒有任何開箱即用的ParserSettings？Univocity - 如何將3（n）行解析爲一行（bean）

AA1234 data 
BBmore data 
CCsome more data row 1 ended 
AA5678 data 
BBmore data 
CCsome more data row 2 ended

更新：

可能是使用：setLineSeparator("\nAA");？

來源

2017-08-04 Ronak Patel

這裏的圖書館的作者。首先你需要定義字段位置。由於您想要解析多行中出現的值，因此您必須將recordEndsOnNewLine設置爲false，以便您處於正確的軌道。

它更容易「看」每個記錄開始的位置和結束，如果你加入的是形成一個單一的記錄行：

String input = "" + 
    "AA1234 data\nBBmore data\nCCsome more data row 1 ended\n" + 
    "AA5678 data\nBBmore data\nCCsome more data row 2 ended";

給你提供了以下字段配置可以創建的例子（我假設你不想要的「AA」，「BB」和「CC」的字符串）：

FixedWidthFields fields = new FixedWidthFields(); 
fields 
     .addField("a1", 2, 6) 
     .addField("a2", 7, 11) 
     .addField("b1", 14, 23) 
     .addField("c1", 26, 40) 
     .addField("c2", 41, 52);

你還可以用這個分析你輸入：

FixedWidthParserSettings settings = new FixedWidthParserSettings(fields); 
settings.getFormat().setLineSeparator("\n"); 
settings.setRecordEndsOnNewline(false); 

FixedWidthParser parser = new FixedWidthParser(settings); 

List<String[]> rows = parser.parseAll(new StringReader(input)); 
for (String[] row : rows) { 
    System.out.println(Arrays.toString(row)); 
}

這會給你正確的輸出：

[1234, data, more data, some more data, row 1 ended] 
[5678, data, more data, some more data, row 2 ended]

現在我們知道每個字段的開始和結束，我們可以定義的Java Bean：

public static class Bean { 
    @FixedWidth(from = 2, to = 6) 
    @Parsed 
    int a1; 

    @FixedWidth(from = 7, to = 11) 
    @Parsed 
    String a2; 

    @FixedWidth(from = 14, to = 23) 
    @Parsed 
    String b1; 

    @FixedWidth(from = 26, to = 40) 
    @Parsed 
    String c1; 

    @FixedWidth(from = 41, to = 52) 
    @Parsed 
    String c2; 

    @Override 
    public String toString() { 
     return "Bean{" + 
       "a1=" + a1 + 
       ", a2='" + a2 + '\'' + 
       ", b1='" + b1 + '\'' + 
       ", c1='" + c1 + '\'' + 
       ", c2='" + c2 + '\'' + 
       '}'; 
    } 
}

隨着那準備，解析輸入變就這麼簡單：

FixedWidthParserSettings settings = new FixedWidthParserSettings(); 
settings.getFormat().setLineSeparator("\n"); 
settings.setRecordEndsOnNewline(false); 
settings.setHeaderExtractionEnabled(false); // This one is important as your input has no headers. 

FixedWidthRoutines routines = new FixedWidthRoutines(settings); 
for(Bean bean : routines.parseAll(Bean.class, new StringReader(input))){ 
    System.out.println(bean); 
}

，它將打印豆子一樣，輸出：

Bean{a1=1234, a2='data', b1='more data', c1='some more data', c2='row 1 ended'} 
Bean{a1=5678, a2='data', b1='more data', c1='some more data', c2='row 2 ended'}

希望這會有幫助

來源

2017-08-04 21:38:25

Univocity - 如何將3（n）行解析爲一行（bean）

回答

相關問題