我正在使用hadoop hadoop-2.2.0。我可以在主節點和從節點啓動historyserver嗎?什麼是使用hadoop 2.2的historyserver的正確方法?
但我不知道我是否需要啓動歷史記錄服務器從 節點上?
如果我在主服務器上啓動一臺歷史記錄服務器,是否可以獲取所有作業的所有日誌?
如果我需要啓動主節點和從節點中的所有服務器,是否有任何命令使用一個命令啓動所有服務器?不要逐個啓動每個服務器。
歡迎任何評論。
我正在使用hadoop hadoop-2.2.0。我可以在主節點和從節點啓動historyserver嗎?什麼是使用hadoop 2.2的historyserver的正確方法?
但我不知道我是否需要啓動歷史記錄服務器從 節點上?
如果我在主服務器上啓動一臺歷史記錄服務器,是否可以獲取所有作業的所有日誌?
如果我需要啓動主節點和從節點中的所有服務器,是否有任何命令使用一個命令啓動所有服務器?不要逐個啓動每個服務器。
歡迎任何評論。
您只需要一個historyserver。它可以在你喜歡的任何節點上運行,包括它自己的專用節點,但傳統上與資源管理器在同一節點上運行。在一個歷史服務器在mapred-site.xml聲明:
mapreduce.jobhistory.address
:MapReduce的JobHistory服務器主機:端口默認端口是10020mapreduce.jobhistory.webapp.address
:MapReduce的JobHistory服務器Web UI主機:端口默認端口是19888.mapreduce.jobhistory.intermediate-done-dir
:歷史文件由MapReduce作業(在HDFS中)寫入的目錄。默認爲/mr-history/tmp
mapreduce.jobhistory.done-dir
:歷史文件由MR JobHistory服務器(在HDFS中)管理的目錄。默認爲/mr-history/done
您可以通過historyserver REST API訪問歷史記錄,但不直接訪問內部歷史文件。對於隨意瀏覽,歷史記錄可在資源管理器Web UI中使用。
假設我想將所有日誌發送到ELK堆棧進行統計查詢,爲什麼不直接訪問歷史文件? – selotape
YARN在主節點上有單個Mapreduce作業歷史記錄服務器。如名稱所示,mapreduce作業歷史記錄服務器的功能是存儲並提供羣集上運行的mapreduce作業的歷史記錄。 – rVr
如何檢索這個歷史記錄,意味着可能有一個文件(或其他)存儲所有工作歷史。我怎麼能看到這個歷史? –
如果您打算使用historyserver,還可以使用日誌聚合。它使事情變得更加簡單和簡單。 – Mehraban