我想知道,當執行在緩存是一個過濾RDD猶若我們進行以下說明:上緩存RDD
val rdd : = sc.textFile("myfile").zipwithIndex.cache
val size = rdd.count
val filter = rdd.filter(_._2 % 2 == 0)
val sizeF = filter.count
在過濾器上執行的操作RDD是執行,如果它是在高速緩存或不是?儘管我們從第一個RDD創建了第二個RDD,但信息來自同一個地方,所以我想知道它是否被複制到需要緩存的新對象中,或者如果過濾對象直接鏈接到了其父項允許更快的行動?