什麼是使用hadoop 2.2的historyserver的正確方法？

我正在使用hadoop hadoop-2.2.0。我可以在主節點和從節點啓動historyserver嗎？什麼是使用hadoop 2.2的historyserver的正確方法？

歡迎任何評論。

2014-02-18 Allen

YARN在主節點上有單個Mapreduce作業歷史記錄服務器。如名稱所示，mapreduce作業歷史記錄服務器的功能是存儲並提供羣集上運行的mapreduce作業的歷史記錄。 – rVr

如何檢索這個歷史記錄，意味着可能有一個文件（或其他）存儲所有工作歷史。我怎麼能看到這個歷史？ –

如果您打算使用historyserver，還可以使用日誌聚合。它使事情變得更加簡單和簡單。 – Mehraban

您只需要一個historyserver。它可以在你喜歡的任何節點上運行，包括它自己的專用節點，但傳統上與資源管理器在同一節點上運行。在一個歷史服務器在mapred-site.xml聲明：

mapreduce.jobhistory.address：MapReduce的JobHistory服務器主機：端口默認端口是10020
mapreduce.jobhistory.webapp.address：MapReduce的JobHistory服務器Web UI主機：端口默認端口是19888.
mapreduce.jobhistory.intermediate-done-dir ：歷史文件由MapReduce作業（在HDFS中）寫入的目錄。默認爲/mr-history/tmp
mapreduce.jobhistory.done-dir：歷史文件由MR JobHistory服務器（在HDFS中）管理的目錄。默認爲/mr-history/done

您可以通過historyserver REST API訪問歷史記錄，但不直接訪問內部歷史文件。對於隨意瀏覽，歷史記錄可在資源管理器Web UI中使用。

2014-02-18 07:45:11

假設我想將所有日誌發送到ELK堆棧進行統計查詢，爲什麼不直接訪問歷史文件？ – selotape

回答