2012-02-01 96 views
5

我是Hadoop的新手。我一直在閱讀HDFS,主要是關於「一次寫作,隨時閱讀」。我有一個用例,我可能需要修改HDFS中存儲的文件。我一直在研究是否有任何方法來做到這一點。更新hadoop HDFS文件

我的問題是可以將HDFS文件加載到HBase中,進行修改並將其保存回HDFS中,並刪除原始文件。如果可行,請讓我。

回答

4

如果您需要更新文件中的值,您可以更好地使用HBase。您仍然可以通過TableInputFormat和TableOutputFormat在MR作業中使用HBase表。如果你想附加數據,你可以使用任何支持hdfs append的hadoop版本,例如0.20.205.0。

+0

謝謝Steve。我可以使用hbase做randow寫入hdfs文件還是僅附加? – 2012-02-01 23:28:04

+0

您可以隨意修改hbase中的記錄。 – 2012-02-02 00:30:46

+0

Steve我已經構建了一個能夠在HDFS文件上的Hbase表。 當我試圖用簡單的'Put'命令更新Hbase記錄im無法看到HDFS中的更改?它不應該自動更新? – Ragav 2014-02-20 22:30:46