2010-12-16 53 views
1

我正在研究用於Pig的JsonStorage。一切正常,但至少我需要從豬模式中獲取字段的名稱(即crdate,名稱,位置)。從Pig獲取字段架構的名稱

| A | crdate: bytearray | name: bytearray | positions: bytearray | 

其實我通過StoreFunc擴展我的類,它沒有提供函數來獲取字段的名稱。

public class PigJsonStorage extends StoreFunc { .. } 

任何人可以幫助我:)

回答

3

免責聲明:我自己對豬有點新鮮,還沒有實施過存儲類。

它在我看來就像StoreFunc有一個這樣的方法:StoreFunc.checkSchema(ResourceSchema s)。我認爲你可以從寫入中使用該模式。

+0

完全正確。 – SquareCog 2010-12-25 20:08:41

+0

它的工作原理!謝謝你! – Christoph 2011-01-11 09:49:44

0

有一類JsonMetadata返回ResourceSchema具有返回字段的數組的方法。

+0

正如我所看到的,getSchema告訴我加載數據的模式,但在處理MapReduce期間生成新字段。所以我需要在元組存儲到文件系統之前的模式:) – Christoph 2010-12-16 11:02:38