2017-04-13 139 views
0

如何使用Apache Tika解析HDF文件(.h5)。使用Apache Tika進行HDF解析

Apache Tika爲.h5文件提供解析器,但使用該解析器無法解析數據。

Parser parser=new HDFParser(); 
Metadata metadata=new Metadata(); 
ContentHandler handler=new BodyContentHandler(); 
FileInputStream fileInputStream=new FileInputStream(path+h5File); 

parser.parse(fileInputStream,handler,metadata,new ParseContext()); 

我可以看到文件的元數據,但使用handler我不能得到內容。

如果有人已經這樣做,請幫助我解決這個問題。

+0

我有一種感覺,HDF解析器僅元數據,但它應該被拉出大部分文件都是元數據。你期望看到什麼,但沒有在元數據中找到? – Gagravarr

+0

我想解析該文件的內容。 –

+1

但是,您希望哪些內容不在元數據中? – Gagravarr

回答

1

只是你不能爲HDF格式文件的性質。

你必須使用metadata.get(field-name-in-string-format);來檢索你想要的信息。

或者你可以直接試試這個Java庫:創建NetCDF(使用它的引擎蓋下,由提卡)