我是HBase的初學者。我目前不確定是什麼影響HBase的性能。首先,我以獨立模式運行Hbase。我用一臺機器運行一個Mapreduce程序來處理200萬條文本行,並將結果輸出到存儲在本地文件系統中的HBase表中。它花了大約1小時40分鐘。然後我改爲僞分佈式模式。 Htable文件然後存儲在HDFS中。包括程序在內的所有其他內容保持不變。然後花了3個多小時!我完全困惑。任何人都可以告訴我爲什麼會這麼快樂嗎?什麼影響Hbase性能
另一個問題,因爲我在Linux機器上創建了5個虛擬機作爲虛擬機羣,它不是很強大(8G ram。3GHz 4核CPU)。當我在一個月前運行Mapreduce計劃時,當我在單個主服務器上運行它或使用另外5個從服務器時,我看到沒有太大區別。所以我認爲CPU可能是瓶頸,但我仍然不確定。任何人都可以肯定的答案,因爲我不熟悉操作系統?我不確定這是IO瓶頸還是CPU瓶頸。我只需在6臺機器集羣上運行該程序,即可將記錄插入HBase表中,並以完全分佈的模式進行操作。它太慢了,所以我殺了這份工作。