2014-02-18 79 views
5

我正在使用hadoop hadoop-2.2.0。我可以在主節點和從節點啓動historyserver嗎?什麼是使用hadoop 2.2的historyserver的正確方法?

  1. 但我不知道我是否需要啓動歷史記錄服務器從 節點上?

  2. 如果我在主服務器上啓動一臺歷史記錄服務器,是否可以獲取所有作業的所有日誌?

  3. 如果我需要啓動主節點和從節點中的所有服務器,是否有任何命令使用一個命令啓動所有服務器?不要逐個啓動每個服務器。

歡迎任何評論。

+0

YARN在主節點上有單個Mapreduce作業歷史記錄服務器。如名稱所示,mapreduce作業歷史記錄服務器的功能是存儲並提供羣集上運行的mapreduce作業的歷史記錄。 – rVr

+1

如何檢索這個歷史記錄,意味着可能有一個文件(或其他)存儲所有工作歷史。我怎麼能看到這個歷史? –

+0

如果您打算使用historyserver,還可以使用日誌聚合。它使事情變得更加簡單和簡單。 – Mehraban

回答

11

您只需要一個historyserver。它可以在你喜歡的任何節點上運行,包括它自己的專用節點,但傳統上與資源管理器在同一節點上運行。在一個歷史服務器在mapred-site.xml聲明:

  • mapreduce.jobhistory.address:MapReduce的JobHistory服務器主機:端口默認端口是10020
  • mapreduce.jobhistory.webapp.address:MapReduce的JobHistory服務器Web UI主機:端口默認端口是19888.
  • mapreduce.jobhistory.intermediate-done-dir :歷史文件由MapReduce作業(在HDFS中)寫入的目錄。默認爲/mr-history/tmp
  • mapreduce.jobhistory.done-dir:歷史文件由MR JobHistory服務器(在HDFS中)管理的目錄。默認爲/mr-history/done

您可以通過historyserver REST API訪問歷史記錄,但不直接訪問內部歷史文件。對於隨意瀏覽,歷史記錄可在資源管理器Web UI中使用。

+0

假設我想將所有日誌發送到ELK堆棧進行統計查詢,爲什麼不直接訪問歷史文件? – selotape

相關問題