2016-08-24 47 views
0

我有一個Spark應用程序,它在運行時基於數據集緩存RDD並執行操作。緩存中有多少RDD Spark

爲了監控目的,我希望在應用程序運行時找出緩存中RDD的數量,Spark是否提供任何API來查找此詳細信息?

+0

@ zero323。這個解決方案只適用於當我想在同一應用程序中獲取緩存rdd。但我想在單獨的程序/應用程序中找到緩存RDD。 –

回答

1

它可以使用Spark REST API它提供了兩個端點:

  • /applications/[app-id]/storage/rdd - 所有存儲RDDS的名單。
  • /applications/[app-id]/storage/rdd/[rdd-id] - 特定RDD的詳細信息。
+0

它在我的本地開發環境中工作。但在我的黃金/鉑金環境中,spark線程服務器安裝在紗線上:(是否有其他選擇? –